NMKD Stable Diffusion GUI の使い方、賢いAIを搭載した画像生成ツール

ソフト
この記事は約13分で読めます。

はじめに

 皆さんは、Stable Diffusionを知っていますか?

 Stable Diffusion は、先に紹介したDALL・E2と同様にテキストから画像を生成するAIですが、オープンソースで自分のパソコンにインストールして、画像生成を行うことができます。

 ということで、今回は、このStable Diffusionについてもう少し深堀して紹介しようと思います。

 この記事を読むと次の疑問について知ることができます。

Stable Diffusionとは?

  Stable Diffusionは、イギリスのロンドンに事務所を置き、2020年にEmad Mostaque氏により設立されたStability AI社が開発した人工知能を搭載した画像生成ツールです。

 Stable Diffusionは、2022年8月22日に初版がリリースされ、現時点(2023年3月11日現在)での最新版は2022年12月7日にリリースされたバージョン2.1です。

 Stabe Diffusionは、拡散確率モデル(Diffusion Probabilistic Models)という手法を用いており、あなたが思い描いた画像のイメージをテキストで入力すると、それに沿った画像を出力してくれます。

 例えば、「cute girl, anime」と入力すると、アニメの可愛らしい少女の画像が生成されます。

 Stabe Diffusionは、約20億個の画像で学習されており、非常に高品質な画像を生成できます。

Stabe Diffusionを利用する方法

 Stabe Diffusionを利用するには、主に3つの方法があります。 

  1. Stabe Diffusionを利用したアプリやWebサイトを利用する方法
    例として、Hugging FaceDream StudioMage
  2. Google Cloboratryを利用する方法
    例えば、次の記事を参照
    Stable Diffusion を Google Colab でシンプルに体験する方法
    【AI画像生成】Google ColabでStable Diffusion web UIを動かす方法
  3. 自分のPCにインストールして利用する方法
    例えば、次のようなWindowsアプリをインストール
    NMKD Stable Diffusion GUI
    Stable Diffusion web UI

ここで紹介するStable Diffusion の利用方法

 上述で示したStabe Diffusionの利用方法には、それぞれ長所や短所があります。

 1の方法は、手軽に利用できStable Diffusion がどのようなものかを知る上では最も良い方法ですが、多くの画像を生成しようとすると費用が掛かってきます。

 2の方法は、パソコンが非力でもGoogle ColaboratryのGPUを利用できますが、これについても多くの画像を生成しようとすると制限がかかったり、費用の発生が生じます。

 3の方法は、自分のパソコンにインストールするために、いくらでも画像を無料で生成できますが、パソコンの能力(特に高性能なGPUが必要)が高い必要があります。GPUを搭載していない非力なパソコンでも利用が可能ですが、画像の生成にかなりの時間を必要とします。

 また、最近私のパソコンを新しいパソコン(MINISFORUM UM690)に買い替えたので、そのパソコンの能力でStable Diffusion を利用した際にどの程度画像生成に時間がかかるかを知る上でも、3の方法の「NMKD Stable Diffusion GUI」(インストール方法が比較的に初心者にも易しい方法)を利用してパソコンにインストールして使ってみようと思います。

NMKD Stable Diffusion GUIの利用

NMKD Stable Diffusion GUIのダウンロード

 NMKD Stable Diffusion GUIを利用するには、次のURLに移動して、画面の左上にある「Download Now」をクリック。

 表示される「Download 'NMKD Stable Diffusion GUI - AI Image Generator'」のウインドウ画面で「No thanks, just take me to the downloads」をクリック。

 次に「Download ”NMKD Stable Diffusion GUI - AI Image Generator”」ダウンロード画面で「SD GUI 1.9.1 (Including SD 1.5 model) 3 GB」の左横にある「Download」をクリック。

 「Thanks for downloading」というウインドウ画面が表示されると共に、右下に「SDG-1.9.1.7z」というファイルがダウンロードされることを確認してください。(この画面は省略)

 私の場合は、ダウンロードするのに約7分程度かかりました。

ダウンロードしたファイルの解凍

 ダウンロードしたファイルは、「7z」という拡張子のファイルで圧縮されていますのでこれを解凍できるアプリを用意します。

 私の場合は、無料で利用できる「7z」を解凍できるPeaZipというオープンソースの圧縮解凍アプリを利用しました。

 PeaZipのインストール等については省略しますが、ダウンロードしたファイルの上で右クリックすると、表示されるメニューで「開く」をクリック。

 PeaZipの画面が表示されますので、解凍するファイルを選択後、上部メニューの「展開 」をクリックして表示されるメニューの中から解凍する場所を選択してクリックして圧縮ファイルを展開して解凍します。

 私の場合は、ダウンロードしたフォルダーに解凍しました。

NMKD Stable Diffusion GUIのインストール

 ダウンロードホルダーに展開すると、フォルダー「SDG-1.9.1」が作成され、そのフォルダー内にある実行ファイル「StableDiffusionGui.exe」をダブルクリックします。

 「Windows によって PC が保護されました」と書かれたウインドウが表示されましたら、「詳細情報」をクリックすると「実行」ボタンが表示されますので、そのボタンをクリック

 2つのウインドウが表示されますので、上のWelcome!ウインドウの下の方にある「Do Not Disply This Message Again」の左横の□にチェックを入れ、「OK」をクリックして閉じます。

 NMKD Stable Diffusin GUI のウインドウの上部メニューにある右から3番目のアイコン「Open Installer」をクリックすると「Installer」のウインドウが立ち上がるので、そのウインドウの「Install」をクリック

 「Setup」ウインドウが開き、「Do you want to download the Stable Diffusion ONNX/DirectML files?
They are only needed if you have an AMD GPU.」と聞いてくるので、「Yes」をクリック

  さらに、「Setup」ウインドウが開き、「Do you want to pre-download the upscaling and face restoration models? (800 MB)」と聞いてくるので、「Yes」をクリック

 「Installer」ウインドウの下の Install ⇒ Re-Install に変化したら、インストールは終了したことを意味しますので、右上の「×」をクリックしてInstallerウインドウを閉じます

NMKD Stable Diffusion GUIを使ってみたよ!

  上述の方法でインストールは終了しますので、NMKD Stable Diffusion GUIの上部にある「Enter your prompt here...」の欄に、あなたが思い描く画像の英文を入力することにより画像が生成します。

 画像生成の条件は、次の通り。

  • Amount Of Images To Generate : 4
  • Generation Steps : 25
  • Prompt Guidance (CFG Scale) : 8
  • Seed (Empty = Random) : Random
  • Resolution (Width x Height) :  512 × 512
  • Sampler : Euler Ancestral
  • Generate Seamless (Tileable) Images : Disabled

超高層ビル

「超高層ビル」の画像生成のために入力したPrompt(呪文)は「skyscraper」です。

 以下に作成した4枚の画像を示します。

雪をかぶった富士山と桜

 「雪をかぶった富士山と桜」の画像生成のために入力したPrompt(呪文)は「Snow capped Mount Fuji and cherry blossoms highly detailed shot from above SIGMA 85 mm F1.4」です。

 以下に作成した4枚の画像を示します。

美しい女性のイラスト

 「美しい少女のイラスト」の画像生成のために入力したPrompt(呪文)は「illustration of a beautiful woman, portrait, detailed beautiful face, detailed hair, detailed human eyes, detailed mouth, detailed arms, detailed bust, looking far away, shot diagonally, artstation, deviantart, concept art, digital painting, award-winning, cinematic postprocessing, cinematic scene, cinematic composition, cinematic lighting」、negative promptとして「profile, backwards」です。

 以下に作成した4枚の画像を示します。

 

 呪文の入力には、「Stable Diffusion入門-美少女を高確率で出す呪文」の記事を参考にさせていただきました。

日本の男の研究者のイラスト

「日本の男の研究者のイラスト」の画像生成のために入力したPrompt(呪文)は「illustration of japanese male researcher detailed beautiful face, detailed hair, detailed human eyes, detailed mouth, detailed arms, detailed bust, looking far away, shot diagonally, artstation, deviantart, concept art, digital painting, award-winning, cinematic postprocessing, cinematic scene, cinematic composition, cinematic lighting」、negative promptとして「profile, beard」です。

 以下に作成した4枚の画像を示します。

 呪文の入力には、「Stable Diffusion入門-美少女を高確率で出す呪文」の記事を参考にさせていただきました。

可愛い女の子(アニメ)

 「可愛い女の子(アニメ)」の画像生成のために入力したPrompt(呪文)は「cute girl, anime」です。

 以下に作成した4枚の画像を示します。

 

作成した美しい女性のイラストの1つを読み込ませ類似の画像を生成

 ここでは、先に生成した「美しい女性のイラスト」の一つ(頭と顔が入っている画像、一番右の画像)を基にPrompt(呪文)は「illustration of a beautiful woman」、negative prompt「profile, backwards」として、画像を4枚生成してみました。

 以下に作成した4枚の画像を示します。

NMKD Stable Diffusion GUI の評判

 NMKD Stable Diffusion GUI につてい、Twitterでのツイートを調べてみました。

 検索ワードは「NMKD Stable Diffsion GUI」で検索して、「最新」から2つほど載せます。

 大変評判も良く人気がある事が伺えます。

NMKD Stable Diffusion GUIを使った感想

 新しいパソコンは、最新のCPU性能(AMD Ryzen™ 9 6900HX )ですので、画像生成についてもかなり早くなると予想していましたが、結果は4~5分/枚となり、内蔵GPU(ビデオRAM:2GB)”を持っていてもその恩恵をほとんど受けられないことがわかりました。

 したがって、NMKD Stable Diffusion GUIを使う条件として、ビデオRAMが4GBM以上のNvidia GPUまたは 8 GB の VRAM を搭載した DirectML 対応の GPUがある方が画像生成の時間を大幅に短縮できると思われます。

 あと、生成画像はかなり綺麗なものが生成され、私としては満足しておりますが、思う通りの画像を生成するにはPrompt や negative Promptを上手に入力(先人の呪文などを参考)する必要があります。

おわりに

 皆さんいかがだったでしょうか。

 Stable Diffusionとは?、Stabe Diffusionを利用する方法、ここで紹介するStable Diffusion の利用方法、NMKD Stable Diffusion GUIの利用、NMKD Stable Diffusion GUIのダウンロード、ダウンロードしたファイルの解凍、NMKD Stable Diffusion GUIのインストール、NMKD Stable Diffusion GUIを使ってみたよ!、超高層ビル、雪をかぶった富士山と桜、美しい女性のイラスト、日本の男の研究者のイラスト、可愛い女の子(アニメ)、作成した美しい女性のイラストの1つを読み込ませ類似の画像を生成、NMKD Stable Diffusion GUI の評判、NMKD Stable Diffusion GUIを使った感想などについて解説してきました。

 この記事が少しでも皆様のお役に立てればこれほど嬉しいことはありません。

以上です。

 

コメント