画像生成AIのStable Diffusionをコマンド不要で簡単に使えるソフト NMKD Stable Diffusion GUI

入力したテキストから画像を生成したり、自分が描いた落書きに説明テキストを加えれば思い通りの絵に変えたりできるAI「Stable Diffusion

温泉でゆったりくつろぐ猫の写真(Stable Diffusionにより生成した画像)
↑a sleeping cat in the hot spring (温泉で眠るにゃんこ) というテキストから自動生成した写真🐱

これを自分のPCで実行できれば、無料で好きな絵や画像を好きなだけ作れます。

(既に Stable Diffusion をオンラインかつコマンド操作不要で利用できるサービスはありますが、一定枚数以上は有料だったり生成速度が遅かったりと制限もあります)

従来は Windows でのローカル実行には煩雑なインストール作業とコマンドによる Stable Diffusion 操作が必須でしたが、有志によりコマンド操作不要で簡単にインストール&使用できるGUIツールが開発されました!

NMKD Stable Diffusion GUI という Windows 用ソフトウェアです。本当にありがたい…!!

以下、インストール手順やソフトウェアの使い方、一緒に使うと便利なツールやサイトについて記載します。

(※既に Stable Diffusion の動作環境を別手順で構築済みでもこちらのソフトはインストール&同居可能です。)

最新情報 (クリックして表示)

2022/09/22

2022/09/21 以前

最新版ソフトのインストール方法

現在の最新版はバージョン 1.4.0 です。(2022/09/22)

最新版ではインストールが簡単になったほか動作条件が緩和されより多くの環境で使用できるため、最新版の使用を強くおすすめします

NMKD Stable Diffusion GUI 1.4.0 のダウンロード・インストール方法をこちらにまとめたので、これから初めてインストールする方はまずこちらをお読みください。

1.4.0のインストール

画像生成AIの「Stable Diffusion」をコマンド操作不要で簡単に使えるソフト「NMKD Stable Diffusion GUI」が 2022/09/20 に大型アップデートしました! 現在の最新版がバージョン 1.4.0[…]

既に 旧バージョンをお使いの方も上記ページの手順で簡単に更新(追加インストール)できます。所要時間は最短5分です。

 

※以下の旧バージョンのインストール方法は新バージョンが動作しない環境のための補足情報なので、必要な方以外は飛ばして次の「NMKD Stable Diffusion GUI の使い方」までスクロールしてください。

 


(旧バージョンの動作条件)

※最新版の動作条件は上記ページをご参照ください。

旧バージョンの動作条件 (クリックして表示)

バージョン 1.2.0

  • 動作OS は Windows のみ
  • Nvidia製GPU が必要 (Nvidia RTX GPU のみサポート。GTXの10シリーズや16シリーズは動作保証外)
  • グラフィックスメモリ (VRAM) は 10GB 以上が推奨
    (6~8GB でも動作しますが、生成できる画像サイズなどに制限がかかることがあります)
  • ★重要★:Windowsのユーザー名に日本語・半角スペースを含まない
  • miniconda 環境をインストールしていないPC

※ユーザー名に日本語・半角スペースが入ってしまっている方は新しいユーザーを作ってそちらにインストールするか、このリンク先の「対処法」の部分をご参照ください。

 

自分が使用しているGPUの種類やVRAM容量はこちらの方法で確認できます。

チップの種類が「NVIDIA ○○」になっていることをご確認ください。

残念ながら、現時点では「Intel(R) HD Graphics ○○」といった Intel製CPUの内蔵GPUや、AMD製GPUには非対応です。

VRAMが10GBに満たないと不安ですが、一応私の環境(8GB)でも動かせたのでVRAM容量不足は現時点では気にしないでください。

(旧バージョン:Ver 1.2.0 のインストール方法)

何らかの事情で旧バージョンを使いたい場合の手順説明です。基本的に最新版をお使いください

※本ページに記載されていた旧情報が必要な場合は、こちらのアーカイブをご参照ください。

Ver 1.2.0 のインストール方法 (クリックして表示)

※環境によってはインストールがうまくいかない場合があります。その場合はこちらを参照↓

インストールエラー・対処法一覧

画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」でインストール時やその後の画像生成がうまくいかないという報告が沢山挙げられていたので対処法を仮まとめ。 […]

 

(旧版 NMKD Stable Diffusion GUI のダウンロード)

ダウンロードは次のリンク先から行えます。

注意:このソフト配布場所は閉鎖される可能性があります。

icedrive

リンク: NMKD Stable Diffusion GUI (Ver. 1.2.0)

 

NMKD Stable Diffusion GUIのダウンロード先

ダウンロード先サイトで、

  1. 最新バージョンのzipファイル (ここでは StableDiffusionGui-v1.2.0.zip) をクリック
  2. 上に現れたダウンロードボタンをクリック

の操作でダウンロードが始まります。(v1.2.0 はサイズが約213MBでした)

 

(旧版 NMKD Stable Diffusion GUI のインストール)

ダウンロードした.zipファイルを解凍します。

解凍先は任意ですが、日本語名のフォルダ内や深すぎる場所にあるフォルダ内でソフトを実行すると予期せぬトラブルが生じる可能性があるので、ドライブ直下に新しく英語名フォルダを作ってその中で解凍するのがいいかもしれません。

(例:Cドライブ直下に「AI」という名前の新しいフォルダを作り、その中で zip ファイルを解凍)

解凍後、中にある「StableDiffusionGui.exe」を起動します。

NMKD Stable Diffusion GUI のインストール方法:ソフトの起動

 

NMKD Stable Diffusion GUI が起動すると、前面にまず次のような注意メッセージが表示されるので「OK」をクリックします。

NMKD Stable Diffusion GUI のインストール方法:警告メッセージ

※注意書きは「このソフトは開発中」「動作できるグラボに制限がある」といった内容です。詳しくは以下。

はじめにお読みください!

このソフトウェアは開発段階であり、バグを含んでいるかもしれません。

重要:
・このソフトを利用するには、最近の (GTX 10 シリーズ以降) の Nvidia製グラフィックカードでなければなりません
・できる限り多くのVRAM(グラフィックスカードメモリ)が必要になります。 8 GB より少ない場合、自己責任でこのソフトをお使いください。全く動かないかもしれません!
・resolution (解像度) 設定は非常にVRAM容量を食います。12 GB 以上のVRAMをお持ちでない限り、512×512より大きい設定にすることを推奨しません。

最後になりますが、このGUIはツールチップを含むので、ボタンやコントロールが何なのか分からない場合はそれにカーソルを重ねればポップアップで情報が表示されます。
楽しんでね!

 

次にメッセージボックスが表示されるので、「OK」を押してください。

NMKD Stable Diffusion GUI のインストール方法:インストール有無の検知画面

※既に Stable Diffusion をローカル環境で利用している場合も「Stable Diffusion の完全にインストールされたファイルは見つかりませんでした」という上記メッセージが表示される場合があります。その時は気にせずOKを押してインストール作業を進めて大丈夫です。

 

インストール画面が立ち上がるので「Install」ボタンを押せばインストールが始まります。

(既にPython環境がPCに入っている場合も特に気にしなくて大丈夫です)

追記:PCに入っているPython環境が miniconda の場合、競合してインストールができない可能性があるみたいです。

NMKD Stable Diffusion GUI のインストール方法:Installボタンを押す

 

後は Stable Diffusion の面倒な環境構築作業を全部ソフトが自動でやってくれます。

押してからしばらく反応が無いですが、一応ソフトの左下にインストール作業の進捗が表示されます(英語)

NMKD Stable Diffusion GUI で表示されるインストール進捗状況

 

注意環境によっては上記画像のように

[O] Setting up python environment...

という行の表示のまま、インストール作業が全く進んでいないように見えることがあります。

しかし、ちゃんとバックグラウンドでインストールは進んでいるので気長にお待ちください。(私の環境ではこの表示のまま15分止まりました)

 

時間が経つと、次のような黒い画面(コマンドプロンプト)が表示されます。

NMKD Stable Diffusion GUI のインストール方法:モデルのダウンロード(自動)

AIのモデルデータをダウンロードしてくれています。サイズが4067MBもあるので、お使いのネット回線状況によっては1時間~数時間かかるかもしれません。

(予想残り時間は Time Left に表示されます。上記画像なら残り8分45秒です。全自動なので一旦PCから離れて別作業していても大丈夫です。)

 

全てのインストール作業が終わると再び Installer の画面が表示されます。

画像のようにインストールが必要な項目全てにチェックが入っていればインストール完了です。

右上の×ボタンを押して閉じてください。

NMKD Stable Diffusion GUI のインストールが完了し、必要な物が自動でインストールされた

本当に完全にコマンド操作不要でインストールが完了してびっくり…!Σ/ᐠ。 . 。 ᐟ\!!

インストールが上手くいかなかった場合…

本ページのコメント欄にインストール時に出たエラーメッセージや、インストールが止まったタイミングなど詳細を記載していただければ原因が特定できるかもしれません。

解決は約束できませんが、調べられる範囲でお調べします。(時間の許す限り。返信は非常に遅くなる場合があります。)

 

9/6 1:30  追記

コメント欄で報告されたエラーについて、それぞれの対処法をこちらのページにまとめました


 

NMKD Stable Diffusion GUI の使い方

まずは1回使ってみる (動作チェック)

Prompt のところが画像生成に使うテキストです。(ユーモアを交えて「呪文」と呼ばれることもあります)

Prompt は英語で記述します。

ここに「a sleeping red tabby cat」(眠っている茶トラ猫)と入力し、右下の「Generate!」(生成!)ボタンを押すと画像の生成が始まります。

NMKD Stable Diffusion GUI の使い方:プロンプトの入力とGenerate!ボタンによる画像の自動生成

生成中は右下に進捗バーが表示されるので少し待ちます。

生成が完了すると無事にゃんこ画像が表示されました!!ฅ/ᐠ˶>ω<˶ᐟ\ฅ

NMKD Stable Diffusion GUI の使い方:生成された画像の保存場所を開く

右下のフォルダマークのボタンをクリックすれば、画像の保存先フォルダを開けます。

(怖いねこ画像になってしまった場合は、「sleeping」 の語句を消せばかわいいねこちゃんが安定して出せるかもしれません…!)

画像を生成してくれない場合…

詳細はこちらのエラー一覧ページをご参照ください。

対処法

NMKD Stable Diffusion GUI の使い方:画像が生成されない場合の対処法

左下の進捗表示欄で Done! (完了!) と表示されているのに、上画像のように全く画像が表示されない場合はVRAM不足が原因のことが多いと思います。

VRAM使用量を減らすには、生成させる画像のサイズを小さくする必要があります。

赤枠で囲った Resolution (解像度) を一番小さい 256×256 にして画像が生成されるか確認してみてください

無事生成されたら、生成される限界までResolutionを上げても大丈夫です。

 

これでも生成できない場合は低VRAMモードにすれば生成できるかもしれません。(主にVRAMが 8 GB 未満のGPU)

ソフト右上のオプションボタン(歯車アイコン)をクリックして設定(Settings)画面を開き、Low Memory Mode にチェックを入れてください。

これで画像が生成できるようになればOKです。

低VRAMモードでは一部機能が無効化されるのでご注意ください。

画像が緑一色・黒一色になり正しく生成されない場合…

対処法

お使いのグラフィックボードが GeForce GTX 16シリーズ (1660, Super, Ti) の場合は既知の不具合です。

ウィンドウ右上の歯車アイコンから Settings (設定) 画面を開き、「Low Memory Mode」と「Use Full Precision」にチェックを入れてください。

運が良ければこれでちゃんと画像が生成するようになるみたいです。(ダメな環境もある模様)

 

各項目の要点

※各設定項目やボタンについては次の項で詳しく説明します。ここでは要点だけ。

  • Load Image ボタン:絵や画像の読み込み
    (自分が描いた絵などから Prompt で指示したスタイルで新しい画像を生成できる機能「img2img」用)
  • Amount Of Images To Generate:生成したい画像の枚数
  • Detail (Steps):画像生成に費やすステップ数。多いほど結果が良くなりやすいが時間がかかる
  • Creativeness (Guidance Scale):大きくするほどpromptで指示したテキストをより正確に表す画像が得られる。
    ※低いほどpromptに関係ない要素が含まれやすくなるが、その分「クリエイティブ」な画像になる
  • Resolution (Width x Height):生成したい画像のサイズ (幅×高さ)。大きくしすぎるとVRAM不足で画像が生成されないことも。

あと、表示されている画像を右クリックすれば便利なメニューを呼び出せます。

(画像をコピー、シード値をコピー、今表示している画像を img2img に使う など)

 

Stable Diffusion と一緒に使うと便利なツールたち (Pick Up)

結局はどんなプロンプトを入力するかが鍵になるので、以下のサービスを利用したり検索かけて情報を集めたりなど…!

(以下、一部ツールのみピックアップしました。今後これ以外の便利なものも含めてまとめ、使い方を説明する予定です)

Lexica

リンク:Lexica

Lexica

The Stable Diffusion search engine…

Promptの入力例を検索できるサイト。

Promptに入れたい文字列で検索をかけると、それを含むPromptで実際に生成された画像と使用されたPrompt全文が表示される。

自分が作りたいスタイルの画像が見つかればPromptを参考にできる。

PromptMANIA Prompt Builder

Start using the best prompt builder for Stable Diffusion - i…

メインのプロンプトを簡単に入力した後、ベースになるスタイルや追加したいスタイルを表示される画像を見ながら押していけばプロンプトを組み立ててくれる。

いつものプロンプトに何かスタイルを加えて工夫したい時などに使える。

(プロンプトのコピーは下の方にある「Copy it」ボタンから)

Stable Diffusion Akashic Records

GitHub

A compendium of informations regarding Stable Diffusion (SD)…

※サービスというか情報源

Stable Diffusion関連の情報が大量にまとめられたリンク集。(随時更新される)

特に「Studies」(研究)の項にはStep数を段階的に変えた時の生成画像の変化や、プロンプトに使う区切り文字(カンマやコロンなど)の変更による影響など、プロンプトや設定パラメータが生成画像に及ぼす影響の調査実験がまとまっておりStable Diffusionの挙動を知るのに有効。

 

画像から画像を生成したい

概要

Stable Diffusionでは文章から画像を生成するだけでなく、画像(+説明文章)から画像を生成することもできます。(img2img)

自分の描いた適当な落書きをAIが自動で清書! なんて夢のようなこともできちゃいます。

 

適当にMSペイントで描いた山と川の絵

例えばMSペイントで描いたこんな適当な落書きから

 

MSペイントで描いた適当な山と川の落書きをStable Diffusionのimg2imgを複数回使い、写真風に変換

こんな感じに綺麗な写真を生成させることができます。

 

方法

詳しい方法を以下ページに記載しました

img2imgのやり方

画像生成AI「Stable Diffusion」は入力したテキストから画像を生成するだけでなく、画像と説明テキストを入力すればそこから思い通りの画像を生成できる img2img も利用できます。 例えばMSペイントで描いたこん[…]

特に、落書きを(絵ではなく)写真に変換するためにはひと工夫必要(img2imgの複数回適用など)なので、詳しい方法は上記ページをご確認ください。

(以下、簡易説明です)

  1. 元の絵(画像)を512×512のサイズで用意
  2. Load Image」ボタンを押し、用意した画像を読み込む
  3. 用意した画像に映っている物や、画像をどのようなスタイルに変えたいかなどをプロンプトに入力する
  4. その他の設定値を調整。画像独自の設定値は「Init Image Strength (Influence)」
  5. Generate! ボタンを押して生成

Init Image Strength (Influence) について

これが大きいほど、与えた画像の影響を強く受けた画像が生成します。(大きすぎると与えた画像とほぼ変わらない出力になります)

小さければ、元の絵からアレンジされた(元の絵と離れた)ものになるので、テキトーな落書きを良さげに化かすには小さい値のほうがおすすめです。(0.150など)

0.025~1.000 までの範囲で調節できます。

画像を繰り返し img2img

できた画像を右クリックして「Use as Init Image」を選べば、その画像を読み込んでまた同じことができます。

 

ソフト各機能や設定値の説明

画像生成パラメータ

NMKD Stable Diffusion GUI で画像生成時に使用するパラメータ(オプション)
※画像は旧バージョンの物なので、一部見た目が異なる箇所があります。

Prompt

画像の生成に使うプロンプト(呪文)。思い通りの絵を生成させるためには生成させたい画像をできるかぎり具体的に詳しく表す文章にする必要がある。

良さげなプロンプトの例や作成のコツは検索すればたくさん出てくるはずなので詳しくはそちら参照。

Amount Of Images To Generate

生成する画像の枚数を指定できる。

最初は数枚~十数枚の画像を生成させながらプロンプトの出来をチェック。

ある程度良いプロンプトが用意できたと思ったら、あとは数十枚~数百枚単位で大量に作って良さげな画像を選別する作業に入る。

(プロンプトによって難易度がかなり異なりますが、自分の場合はだいたい100枚あたり5枚くらい良さげな画像ができればOK!くらいの感じでやっています)

Detail (Steps)

画像生成に費やすステップ数。多いほど結果が良くなりやすいが生成に時間がかかる。

おすすめのステップ数は 50

Stable Diffusion のデフォルトのStep数が50 なので、とりあえず50にしてみて後で速度・品質のどちらをとるかに応じて上げ下げすればOK。

↑デフォルトの設定値についてはStable DiffusionのGitHubリポジトリのREADME.mdに記載されている。

Creativeness (Guidance Scale)

値が大きければプロンプトで指示したテキストにより忠実な画像が得られる。(ただし大きすぎるととんでもないことになる)

逆に小さくするほどプロンプトに関係ない要素が含まれやすくなるが、その分「クリエイティブ」な画像になる。

おすすめの値は 7.5

これも Stable Diffusion のデフォルト値。

Stable Diffusion の利用解説記事によると、7~8.5 の範囲にするのが良いらしい。

値を大きくするほどちゃんとした画像に収束するまでに必要なStep数が増えるので注意。

ステップ数(s)とGuidance Scale(cfg)を段階的に変えた時に同じ画像がどのように変化するか一目で分かる資料
リンク:Stable Diffusion CFG Studies
Seed

(プロンプトや各パラメータが同じ状態で) Seedが同じ値なら同じ画像が生成される。

つまり他の人が自分と全く同じプロンプト・各設定でSeedも同じ値にすれば、同一の画像を生成できる。

よって、このSeedやその他条件を含めて記録しておけば自分の画像がStable Diffusionで生成したものであることを示すこともできる。

※デフォルトの空欄状態ではランダム指定なので、勝手にSeedの値を変えて画像を生成してくれている。

なお、一度に複数枚の画像をソフトで生成したときはSeed値が連番になる。

(次に再びGenerate!を押すとまた別のランダムなSeed値から始まる連番になる)

Resolution (Width x Height)

生成したい画像のサイズ (幅×高さ)。

推奨値は 512×512

大きくしすぎるとご使用のグラフィックボードによってはVRAM不足で画像が生成されない。

値は64刻みで指定可能。

Sampler

Step数を増やしていけば生成される画像はいずれ特定の見た目に収束するが(多分)、各Samplerごとに収束までの速度や収束過程の画像が異なる。

指定可能な8つのSampler (k_euler_a, k_euler, k_lms, ddim, plms, k_heun, k_dpm_2, k_dpm_2_a) ごとに生成画像を比較した画像表があるので以下のリンクを参考に。

8サンプラーの生成画像をStep数2~64で比較
リンク:Sampler vs. Steps Comparison (low to mid step counts)

8サンプラーの生成画像を9種類のプロンプトで、Step数50, 64, 200 で比較
リンク:画像

ソフト側の初期設定は k_euler_a で、Stable Diffusion での初期値は plms

収束が速ければ少ないステップ数でもpromptに近い内容の画像が生成されやすくなるので速度重視の場合はいいのかも。

ただ収束前であっても良い感じの画像が得られることがたくさんあるので収束速度は絶対ではない。

結局Sampler選びは好みになるかも。(しかも生成させる絵によって傾向が全然異なる)

なおソフトでは k_euler_a が推奨されています。比較的少ないステップ数でも良さげな画像が生成されやすいと思います。

 

※以上ざっくり記載しましたが、全く厳密な説明になっていないのでその点をお詫び申し上げます。
(肝心な技術仕様を何一つ理解できていない。例えば diffusion model の要点 とか前提知識なんだろうけど何一つ知らない…。)

 

画像右クリックメニュー

 NMKD Stable Diffusion GUI の画像右クリックメニュー

項目名 機能
Open File 画像を(フォトビューアなどで)開く
Open Output Folder 画像の生成先フォルダを開く
Copy Image 画像をクリップボードにコピーする
Copy Seed その画像の生成時に設定されていたSeed値をコピー
Use as Init Image 画像を img2img 用に設定

 

もっと便利な/楽しい機能

本ページにまとめきれなかった機能たちは以下のページにまとめました!

画像の高画質化・顔修復・シームレス素材化

NMKD Stable Diffusion GUI 1.3.0 の新機能:顔復元(Face Restruction)

画像の高画質化

画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」が 2022/09/06 についにバージョン更新…! 現在の最新版がバージョン 1.3.0 になり[…]

 

アニメ風な別モデルの使用・重み付きプロンプト

Waifu Diffusion モデルで生成したイケメンにゃんこキャラクターの画像

NMKD Stable Diffusion GUIで重み付きプロンプトを使用して生成した写真の比較

アニメ風モデルを使う

画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」で利用可能な便利機能をまとめました。 プロンプト中の語句に数値で重み付けできたり Creative[…]

 

情報源

※本ページもソフト側のバージョンアップに合わせて随時更新 って感じなので、現時点で不足している情報や最新情報などは以下リンクをご参照ください(英語)

ソフト公式ページ

リンク:NMKD Stable Diffusion GUI - AI Image Generator

reddit

↓開発者さん本人が随時情報を更新しています。

リンク(Ver. 1.4.0):NMKD Stable Diffusion GUI 1.4.0 is here!

リンク(Ver. 1.3.0):My Stable Diffusion GUI update 1.3.0 is out now!

リンク(Ver. 1.2.0):My easy-to-install Windows GUI for Stable Diffusion is ready for a beta release!

開発者さんのDiscordサーバー

リンク:NMKD Software

GitHub リポジトリ

リンク:text2image-gui

※オープンソースソフトウェアです。

 

その他感じたことなど

  • Stable Diffusion の公開直後はコマンド入力でずっと画像を生成させていたけど、1週間も経たないうちにGUIで簡単に操作できるソフトが出現して驚き…!!
  • そして次々色々な技術が増え続けて、今はもう完全に追いきれていないです…!
  • 少し前に手動でStable Diffusionのファインチューニングをやっていたので、NMKD Stable Diffusion GUI でも機能追加で対応してくれたら嬉しい! (適用ではなく訓練の方)
パソコン相談も受付中(*・ᴗ・*) よろしければフォローお願いします(懇願)