はじめに
皆さんは、DreamStudio を知っていますか?
DreamStudio は、先に紹介したDALL・E2 、 Stable Diffusion 、Midjourney(ミッドジャーニー)、Leonard.Ai、Diffusion Artと同様にテキストから画像を生成できるツールですが、「Stable Diffusion」を開発したStability AI社が最近発表したモデル「Stable Diffusion XL (SDXL)」のベータ版を利用できるサービスです。
ということで、今回は、この DreamStudio についてもう少し深堀して紹介しようと思います。
この記事を読むと次の疑問について知ることができます。
DreamStudio とは?
DreamStudioとは、Stability AI社が開発・運営する画像生成AIの「Stable Diffusion」のオープンβ版として2022年8月23日に公開されたサービスです。
テキストを入力すると、それに合った画像を生成することができ、画像のサイズや類似度、処理回数なども指定できます。生成された画像の著作権はフリーで自由に利用が可能です。
DreamStudioはブラウザで動作するので、WindowsでもMacでもどちらでも使え、メールアドレスを使った登録や「GoogleあるいはDiscord」アカウントを連携してログインすることで、無料トライアルとして25クレジットが付与されます。
そのクレジットを使用することで、テキストから画像が生成でき、クレジットは画像のサイズや処理回数などによって消費量が変わりますが、クレジットがなくなった場合は、料金を支払って追加することが可能です。
なお、利用する際には「利用規約」や「プライバシーポリシー」をよく読んだうえで利用するようにしてください。
DreamStudio にログイン
DreamStudioを利用するためには、DreamStudioにログインするする必要があり、そのためにはDreamStudioも画像生成画面の右上にある「Login」をクリックします。
Stability AiのWelcome画面が表示され、そこにあなたのメールアドレスとパスワードを記入するか、Google又はDiscordのいずれかを選んで(ここでは、「Continue with Google」をクリック)「Continue」をクリックすると「Googleのログイン」画面が表示されアカウントの選択画面であなたが使うGoogleのアカウントを選択、すると、「DreamStudio is requesting access to your DreamStudio account.(DreamStudioは、お客様のDreamStudioアカウントへのアクセスを要求しています。)」と聞いてくるので、「Accept」をクリックします。
以上により、画像生成が利用できる画面になります。
DreamStudio の使い方
DreamStudioの使い方は、簡単で、生成したい画像のモデルを選択、画像のスタイルを選択、PromptやNegative Promptを記入、「settings」で画像の解像度と生成枚数を選択した後に「Dream」ボタンをクリックすれば画像が生成されます。(画像を生成する場合は、Generateをクリックするよりは、下の方にあるDreamボタンをクリックした方がよい。)
モデルによる生成する画像の違い
モデルには、「Stable Diffusion V1.5」、「Stable Diffusion V2.1」、「Stable Diffusion V2.1-768」、「SDXL Beta」がありますので、これらの違いを同じプロンプトを記入し、その他の条件を同じにして生成してみました。
DreamStudioで選べるプロンプト
Prompt :Stunning sunset over a futuristic city, with towering skyscrapers and flying vehicles, golden hour lighting and dramatic clouds, high detail, moody atmosphere
Negative Prompt:なし、Style:Enhance、生成枚数:1、生成画像の解像度:1:1(512×512、768×768)
生成した画像は次の通り。
美しい女性(Leonardo.Aiから引用したプロンプトを利用)
Prompt :medium shot of a beautiful women with sunkissed tan olive skin, long brown silky hair, amber eyes, big almond eyes, long eyelashes, realistic, stunning realistic photograph, smart, kind, energetic, cheerful, creative, with sparkling eyes and a contagious smile, 3d render, octane render, intricately detailed, cinematic, trending on artstation, Isometric, Centered hipereallistic cover photo, awesome full color, hand drawn, dark, gritty, mucha, klimt, erte 12k, high definition, cinematic, neoprene, behance contest winner, portrait featured on unsplash, stylized digital art, smooth, ultra high definition, 8k, unreal engine 5, ultra sharp focus, intricate artwork masterpiece, ominous, epic, TanvirTamim, trending on artstation, by artgerm, h. r. giger and beksinski, highly detailed, vibrant
Negative Prompt:close up, two heads, two faces, naked, nudity, plastic, Deformed, blurry, bad anatomy, bad eyes, crossed eyes, disfigured, poorly drawn face, mutation, mutated, ((extra limb)), ugly, poorly drawn hands, missing limb, blurry, floating limbs, disconnected limbs, malformed hands, blur, out of focus, long neck, long body, ((((mutated hands and fingers)))), (((out of frame))), blender, doll, cropped, low-res, close-up, poorly-drawn face, out of frame double, two heads, blurred, ugly, disfigured, too many fingers, deformed, repetitive, black and white, grainy, extra limbs, bad anatomyHigh pass filter, airbrush, portrait, zoomed, soft light, smooth skin, closeup, deformed, extra limbs, extra fingers, mutated hands, bad anatomy, bad proportions , blind, bad eyes, ugly eyes, dead eyes, blur, vignette, out of shot, out of focus, gaussian, closeup, monochrome, grainy, noisy, text, writing, watermark, logo, oversaturation , over saturation, over shadow, bra
Style:Enhance、生成枚数:1、生成画像の解像度:1:1(512×512、768×768)
生成した画像は次の通り。
上述の画像を見ると、SDXL Betaの画像は他の画像と比較してより自然な肌色、鮮明であることが分かります。
以降については、SDXL Betaで色々試してみたいと思います。
Stable Diffusin SDXL Bata の試用
Styleの違いによる生成画像の違い
スタイル(16種類)により画像がどのように変化するかを見てみましょう。
Prompt : A cute girl、Negative Prompt:なし、画像の解像度:1:1(512×512)、画像生成枚数:1、Advancedの設定からSeed:60541540
生成する画像がStyleによりかなり違った画像が生成されることが分かります。
この時点で、クレジットは5.6となり、あまり試すことができませんが、次にImage to imageを試してみたいと思います。
Image to image
ここでは、Leonardo.Aiの「Leorardo Diffusion」で作成した「赤ちゃんのフェニックス」の画像を基にしてImage to image を試してみました。
Prompt : adorable, lovely, whimsical, cute and quirky, cartoon art, 4K resolution, red phoenix, sitting, baby phoenix
style : 3D model、Image strength :30%,50%,100%(元画像を再現)
この時点で、残りのクレジットが2.3しか残っていなので、これで画像生成の試行は終わりにします。
DreamStudio を使った感想
DreamStudioは、テキストを入力するだけで、それに沿った画像を生成してくれる画像生成AIのサービスです。
DreamStudioを使ってみて、以下の点が良いと感じました。
- 画像生成の速度が比較的速いこと。数十秒程度で画像が出力されるので、ストレスなく試行錯誤が可能なこと。
- 画像生成の精度がとても高いこと。特にSDXL Betaは入力したテキストに忠実に画像が生成されるので、自分のイメージを具現化し易いこと。
- 画像生成の幅がとても広いこと。風景や動物や人物など、様々なジャンルの画像が生成できます。また、設定項目を変えることで、画像のサイズや類似度や処理回数などを調整が可能なこと。
- 生成された画像の著作権フリーであることから営利目的でも自由に利用できるので色々なことに活用が可能なこと。
しかし、改善の余地はあると思います。例えば、以下の点が挙げられます。
- テキスト入力が英語に限られていること。日本語に対応してくれればもっと使いやすくなること。
- 無料トライアルでは25クレジットしか付与されず、それを超えると有料になること。もう少し多くのクレジットがもらえれば色々試せること。
今後も開発者の方々には頑張っていただき、さらなる改良により使い易くしていってもらえればと思う次第です。
なお、AIキャンバス、アップスケール、インペイント、アウトペイントで画像内の要素を置換、追加、編集などが行える機能が続々と追加予定と書かれていました。
おわりに
皆さんいかがだったでしょうか。
DreamStudio とは?、DreamStudio にログイン、DreamStudiot の使い方、モデルによる生成する画像の違い、DreamStudioで選べるプロンプト、美しい女性(Leonardo.Aiから引用したプロンプトを利用)、Stable Diffusin SDXL Bata の試用、Styleの違いによる生成画像の違い、Image to image、DreamStudio を使った感想などについて解説してきました。
この記事が少しでも皆様のお役に立てればこれほど嬉しいことはありません。
以上です。
コメント
[…] DreamStudioの基本操作と使い方を初心者向けに分かり易く解説 […]