Leonardo.Aiの新モデルDreamShaper v5、ControlNet、スケールアップ他便利な機能を紹介!

AI画像生成ツール
この記事は約13分で読めます。

はじめに

 前に、Leonardo.Aiの使い方などについて紹介しましたが、今回は新モデルDreamShaper v5他、前回紹介しきれなかった機能に焦点を当てて紹介します。

 2023年5月8日に「Prompt Magic V2(ベータ)」の部分を加筆しました。

 この記事を読むと次の疑問について知ることができます。

DreamShaper v5

 元々DreamShaper 3.2があり、これの新モデルとしてバージョン4を飛び越えてDreamShaper v5が2023年4月23日頃にリリースされたようです。

 DreamShaper v5は、Stable Diffusion v1.5を基にして作成されたモデルで、美しいCGを作るのが得意で写真のようなリアルな画像やイラスト系の画像も生成できます。

 それでは、実際に試してみましょう。

 Leonardo.Aiにログインしたホーム画面から上部のモデルから「DreamShaper v5」をクリックし、表示される「DreamShaper v5の画面で、「Generate with this Model」をクリックすると、画像生成画面に移行します。

キラウエア火山の噴火

 ハワイ島にあるキラウエア火山の噴火の画像を生成してもらいましょう。

 先ず、Promptを生成して、生成したPromptを使って画像生成をします。

 画像生成画面で、下の方にある「Prompt Generation」をクリックし、Prompt生成画面でPromptの生成数(ここでは、4を指定)を選択し、「Enter a basic prompt idea...」の欄に「Eruption of Kilauea Volcano」(キラウエア火山の噴火)と記入して、横にある「Ideate」をクリックすると、Promptが4つ生成されます。

 4つのPrmptそれぞれコピーして、画像生成のPromptにペーストして作成した画像が次の通りです。

 これらの画像を見ると、どれもきれいな画像ですね!

色々な種類の画像

 次に、色々な種類の画像(風景、動物、人物、想像する物(例えば、空を飛ぶペガサス))を生成してもらいましょう。

 風景のPrompt : Snow-covered Mt. Fuji and autumn leaves(雪のかぶった富士山と紅葉)
 動物のPrompt : Portraits of tigers(虎のポートレイト)
 人物のPrompt : A girl in a beautiful kimono(綺麗な着物を着た少女)
 想像する物のPrompt : Flying Pegasus(空を飛ぶペガサス)

 以下が、生成した画像です。

 これらの画像を見ると、動物(虎)の画像以外はよーく見ると少し変な画像が生成されています。風景画の(雪のかぶった富士山と紅葉)は富士山の下にもう一つの富士のような山が描かれていたり、人物(綺麗な着物を着た少女)の生成画像では、日本傘の部分が変に描かれていたり、想像の物(空を飛ぶペガサス)の生成画像では、ペガサスの足が2本しか描かれていないなど、「Negative Prompt」を入れてこのような画像を生成しないようにする工夫が必要でしょう。

美しい女性

 今度は、美しい女性を写真風、イラスト風、アニメ風、水彩画風で描かせてみました。

 主Prompt : a beautiful women, portraits
 写真風(photographic style)、イラスト風(illustration style)、アニメ風(anime style)、水彩画風(watercolor style)を付け加えてそれぞれを作成したのが次の画像です。

 こちらの画像も、それぞれ特徴のある画像に仕上がっています。

背景画の削除

 Leonardo.Aiでは、生成した画像の背景画を簡単に削除が可能です。

 背景画を削除したい画像を選択しクリックして、表示される画像の下の方にある「Remove background」をクリックすることにより、背景画が黒くなった画像で生成することができます。

 背景画が削除された画像を見るには、画像の下にある「Original Image」(「Original Image」が表示されない場合は、一旦ログアウトし、再度ログインしてください。)をクリックすると、「No Background」があるので、をれをクリックすると、背景画が削除された画像が表示されます。

下記の画像は、色々な画像で背景削除してみました。

ControlNetの利用

 Leonardo.AiのControlNetは、読み込んだ画像の輪郭、ポーズなどを参照して、画像を生成できる機能です。

 したがって、ある生成した画像と似た輪郭や好きなポーズをさせたいと思う際に利用できます。

 ここでは、青い服を着た美しい美人の画像(a beautiful woman in blue dress)を読み込んだ画像にホーズなどを似せて生成したいと思います。

 画像生成画面で、座った画像をImage to image」で読み込み、「ControlNet」を右にずらして「ON」にし、「Pose to Image」をクリックして画像を生成すると、次のような画像となります。

 また、画像生成画面で、立ってポーズをとった画像を「Image to image」で読み込み、「ControlNet」を右にずらして「ON」にし、「Edge to Image」をクリックして画像を生成すると、次のような画像となります。

 さらに、画像生成画面で、顔のクローズアップした画像を「Image to image」で読み込み、「ControlNet」を右にずらして「ON」にし、「Depth to Image」をクリックして画像を生成すると、次のような画像となります。

Prompt Magic V2(ベータ)

 Prompt Magic V2(ベータ)とは、「これは実験的なレンダリングパイプラインで、プロンプトにより忠実に従います。現在はトークンコストに倍率がかかりませんが、4月中旬にはGPUのオーバーヘッドが高いため、トークンコストに2倍の倍率がかかるようになります。」と書かれており、この機能をONにすると、入力したPromptにできる限り忠実な画像が生成され、トークンのの消費が2倍になるということのようです。

 この機能は、全てのモデルで利用できますので、モデルと入力したPromptに忠実に画像生成がされるということです。

 Prompt Magic V2をオンにすると表示される「High Contrast」、「Prompt Magic Strength」の意味は次の通り。

  • High Contrast
    この機能をONにすると、画像にコントラストが強くなり、影が多くなります。これにより、画像に暗い雰囲気が出ます。プロンプトに合わせて画像の明るさを調整したい場合は、このトグルをオフにしてください。PMv2で生成された画像がプロンプトに対して暗すぎると感じたら、このトグルをオフにすることをおすすめします。
  • Prompt Magic Strength
    画像の出力にPrompt Magicがどれだけ影響を与えるかを示す数値です。数値が高いほど、Prompt Magicの影響が強くなります。

 それでは、実際に試してみましょう。

少女のコミック風イラスト画

 元画像は、Leonardo.Aiから「jsxai」と言う方が描いた画像を拝借しました。

 画像の生成条件は次の通り。

  • モデル : DreamShaper v5
  • Prompt
    A detailed illustration of a Japanese girl cook is smiling and holding a bowl of ramen noodles, t
    he girl wearing overalls, style cartoon, colors, two-dimensional, planar vector, character design, T-shirt design, stickers, colorful splashes, and T-shirt design, Studio Ghibli style, orange color background, soft tetrad color, vector art, fantasy art, watercolor effect, Alphonse Mucha, Adobe Illustrator, hand-painted, digital painting, low polygon, soft lighting, aerial view, isometric style, retro aesthetics, focusing on people, 8K resolution, using Cinema 4D
  • Negative prompt
    incorrect hands, extra limbs, extra fingers, fused fingers, missing facial features, low quality, bad quality, bad anatomy, Missing limbs, missing fingers, scary, ugly, extra face, 2 heads, elongated body, 2 faces, cropped image, out of frame, draft, deformed hands, signatures, twisted fingers, double image, long neck, malformed hands, multiple heads, extra limb, ugly, poorly drawn hands, missing limb, disfigured, cut-off, kitsch, ugly, over saturated, grain, low-res, Deformed, blurry, baad anatomy, disfigured, poorly drawn face, mutation, mutated, floating limbs, disconnected limbs, out of focus, long body, disgusting, poorly drawn, mutilated, mangled, extra fingers, duplicate artefacts, morbid, gross proportions, missing arms, mutated hands, mutilated hands, cloned face, missing legs, signature, watermark Multiple bodies, 2 heads, 2 faces, text, extra bowls , heterochromia, cropped image, e, draft, deformed hands, twisted fingers, double image, malformed hands, multiple heads
  • 解像度 : 704 x 1024px
  • Seed 値 : 671811072
  • その他の条件 : デフォルト

 同じモデル、シード値を使っても必ずしも同じ画像にはならないことが分かります。

 Prompt Magic V2(ベータ)を利用すると、確かに元画像と画風が同じになり、Prompt Magic Strengthを大きくするほど元画像に近い画像が生成するようです。

 次に写真風の画像について、Prompt Magic V2(ベータ)の効果を見てみましょう。

写真風の美しい女性

 今度は、Promptを簡単な「Beautiful woman with beautiful black eyes., potrait, Realistic photo style」として、Prompt Magic V2(ベータ)の効果を見てみました。

  • モデル : Deliberate 1.1
  • Prompt : Beautiful woman with beautiful black eyes., potrait, Realistic photo style
  • Negative prompt : なし
  • 解像度 : 704 x 1024px
  • Seed 値 : 605210368
  • その他の条件 : デフォルト

 Prompt Magic V2(ベータ)の効果が、明らかに出ています。Prompt Magic V2(ベータ)がOFFであるとどうしても顔が2重に描かれてしまうような場合でも、Prompt Magic V2(ベータ)がONにすることにより、Negative promptを入れなくとも、綺麗な画像が生成されます。

 Prompt Magic Strengthを大きくするほどより現実的な写真風の画像が生成されます。これが、正にPrompt Magic V2(ベータ)の効果と言えるでしょう。

 最後に、アニメ風の動物の絵で効果を見てみましょう。

アニメ風の動物の絵

 今度は、PromptをLeonardo.Aiから「2animals」で画像を検索した中から選んだ画像のPromptのみを参照し、Negative promptをなしにして画像を生成させ、Prompt Magic V2(ベータ)の効果を見てみました。

  • モデル : Cute Animal Characters
  • Prompt
    2 animals: a cute dog and a cute lion chatting in the forest, Watercolor Clipart, strybk, full Illustration, 4k, sharp focus, watercolor, smooth soft skin, symmetrical, soft lighting, detailed face, concept art, muted colors, watercolor style, strybk, children's style fairy tales, chibi kawaii, . Octane rendering, 3d. Perfect face, detailed face, delicate face, perfect sharp lips, detailed eyes. Craig Davison, Aubrey Beardsley, Conrad Roset, Aikut Aidogdu, Agnes Cecil, anime style
  • Negative prompt : なし
  • 解像度 : 1024 x 704px
  • Seed 値 : 199357696
  • その他の条件 : デフォルト

 上述の画像を見ると、High Contrast のON、OFFにより画像の濃淡がはっきり出ており、Prompt Magic Strengthを大きくするほど、入力したPromptに忠実(可愛らしさ、cute)に反映した画像が生成されていることが分かります。

Upscale

 Leonardo.Aiでは、元画像(640×1152ピクセル)から色々な方法でアップスケールができます。

 元画像は、Leonardo.Aiの中に「KasimGuo」と言う方が生成した画像から「Remix機能を使って、Init Strengthを0.9にして、ほぼ同様な画像を生成したものです。

 以下にアップスケールの種類を挙げておきます。

  • Unzoom(800×1140ピクセル)
    外側を拡大する機能
  • Creative upscale(1696×3056ピクセル)
    画像の細部を保持しながら、ノイズやぼやけを減らして、より鮮明な画像にします。
  • Upscale image alternate(2016×3632ピクセル)
    この機能は、「Creative upscale」で画像の詳細が失われるような場合に利用
  • HD smooth Upscaler(1280×2304ピクセル)
    焦点を絞った被写体でうまく機能するアップスケーラーですが、細部を滑らかにする可能性があります。
  • HD Crisp Upscale(1280×2304ピクセル)
    画像の詳細と鮮明さを十分に保持する優れたバランスの取れたアップスケーラー

 上述のアップスケールを横に並べて示したのが次の画像です。

おわりに

 皆さんいかがだったでしょうか。

 DreamShaper v5、キラウエア火山の噴火、色々な種類の画像、美しい女性、背景画の削除、ControlNetの利用、Prompt Magic V2(ベータ)、少女のコミック風イラスト画、写真風の美しい女性、アニメ風の動物の絵、Upscaleなどについて解説してきました。

 この記事が少しでも皆様のお役に立てればこれほど嬉しいことはありません。

以上です。

 

コメント

タイトルとURLをコピーしました