NMKD Stable Diffusion GUI 1.6.0 の新機能・導入/更新方法

画像生成AIの「Stable Diffusion」をコマンド操作不要で簡単に使えるソフト「NMKD Stable Diffusion GUI」 が 2022/10/17 に更新されました!

現在の最新版はバージョン 1.6.0 です。

1.5.0 と比べて利便性が向上しているほか、VRAM 24GB あるなら話題の DreamBooth をコマンド操作不要で簡単に実行できる凄い機能も追加されています。

以下に概要と更新方法を記載します。

Ver. 1.5.0 → Ver 1.6.0 の変更点

※以下要点です。詳しい公式発表はこちら

※各機能の詳しい説明は「ソフトの使い方 (初めて使う方向け)」の項の次に記載しています。

※ソフトダウンロード先:NMKD Stable Diffusion GUI - AI Image Generator

新機能の追加

  • Dreambooth トレーニング好きな画像を学習させてオリジナルモデルを作成 (要VRAM24GB)
  • プロンプト強調構文のサポート 
    ↑ (括弧) で囲った語句の強調度合いが大きくなり、{中括弧} で囲った語句は逆に強調度合いが小さくなる。
    ↑括弧を任意個数重ねて (( ))  {{ }} 強調をより強める/弱める ことも可能
  • Ctrl+M のショートカットキーでモデルファイルを素早く切り替え可能に
  • モデル保存先フォルダーを任意個数登録可能に:(モデルフォルダーマネージャー)
  • ポップアップ画像ビューアの機能追加
    ↑マウスホイールで拡大縮小・常に手前に表示するオプション・矢印キーで表示画像の変更

利便性改善・不具合修正

  • ホットキーが追加され、キーボードからの操作が容易に
  • プロンプト入力欄で Ctrl+BackSpace キーで1単語ごと削除可能に
  • モデル剪定ツールで剪定が成功した場合に剪定前のモデルファイルを削除するオプションを追加
  • 画像生成中に Cancel を押すとソフトが強制終了する不具合の解消
  • 最初のエントリを実行した後にプロンプ​​ト キューが機能しない問題を修正

公式ガイドの追加 (英語)

ソフト使い方ガイド(公式):NMKD Stable Diffusion GUI

DreamBooth 訓練ガイド(公式):DreamBooth Training GUI

 

動作条件 (Ver 1.6.0)

  • 動作OS は Windows 10, Windows 11
  • 12 GB のディスク空き容量
  • 8 GB の RAM
  • Nvidia製GPU が必要
  • ★重要★:Windowsのユーザー名に日本語・半角スペースを含まない

ビデオメモリ(VRAM)容量が3GB以上6GB未満の場合は低速低メモリモードで動作可能で、6GB以上であればより多くの機能を利用できる高速モードで動作可能です。

GPU の代わりに CPU で画像を生成するオプションがありますが、実験的機能で動作するかどうか不明なため GPU 推奨です。

※ユーザー名に日本語・半角スペースが入ってしまっている方は新しいユーザーを作ってそちらにインストールするか、このリンク先の「対処法」の部分をご参照ください。

 

自分が使用しているGPUの種類やVRAM容量はこちらの方法で確認できます。

チップの種類が「NVIDIA ○○」になっていることをご確認ください。

残念ながら、現時点では「Intel(R) HD Graphics ○○」といった Intel製CPUの内蔵GPUや、AMD製GPUには非対応です。(もしかしたらCPU画像生成オプションが使えるかも)

 

※詳しい動作条件はこちらの公式ドキュメントの項目に記載されています。

推奨は VRAM 8GB 以上、DreamBooth を使用するなら VRAM 24 GB 以上です。

 

Ver 1.6.0 のインストール・更新方法

新規に NMKD Stable Diffusion GUI 1.6.0 をインストールする方も、既に旧バージョン(1.5.0 以前) をインストールしていた方も導入方法は同じです。

ソフト本体にアップデート機能がないため現時点ではもう一度インストールする以外に方法はありません。

新しいフォルダにインストールするので旧バージョンのフォルダ・ソフトは消さなくて大丈夫です。

※環境によってはインストールがうまくいかない場合があります。その場合はこちらを参照↓

インストールエラー・対処法一覧

画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」でインストール時やその後の画像生成がうまくいかないという報告が沢山挙げられていたので対処法を仮まとめ。 […]

 

ソフト NMKD Stable Diffusion GUI のダウンロード

ダウンロードは次のリンク先から行えます。

リンク:NMKD Stable Diffusion GUI - AI Image Generator

 

ページの下の方にある「Download Now」をクリックします。

NMKD Stable Diffusion GUI 1.6.0 のダウンロード方法

 

開発者さんのサポート画面になります。サポートしたい場合は赤枠の支払い設定に進み、そうでない場合は青枠部分のリンクをクリックしてダウンロードページに進みます。

NMKD Stable Diffusion GUI 1.3.0 のダウンロード前:開発者サポート画面

サポートしたい場合の手順 (クリックして表示)

支援額は自由に入力できます。入力後、支払い完了メールの送付先メールアドレスをボックスに入力し、PayPalかクレジットカードで支払いを行います。

PayPalの場合、ボタンを押してPayPalアカウントにログインすると支払いが完了します。

支払い完了後、以下のような支払い完了画面に遷移するはずです。(支払い完了メールも送られてきます)

 

ダウンロードページには2つの Download ボタンがありますが、ダウンロードはどちらか片方だけで大丈夫です。

初めて NMKD Stable Diffusion GUI をダウンロードする方は上の Download をクリックしてください。(画像生成に必要なモデルファイルが含まれています)

既に前バージョンのソフトを持っている場合は、モデルを自前で新ソフトに移せばわざわざモデルをもう一度ダウンロードせずに済むので下を選んでもOKです。

NMKD Stable Diffusion GUI 1.6.0 のダウンロード方法:Downloadボタン

 

Download を押すとダウンロードが始まります。Ver 1.6.0 の容量はモデルあり(上)が約3.6GB、モデルなし(下)が約1.8GBです。

 

NMKD Stable Diffusion GUI のインストール

ダウンロードした.7zファイルを解凍します。(.7z の解凍方法はこちら)

解凍先は任意ですが、日本語名のフォルダ内や深すぎる場所にあるフォルダ内でソフトを実行するとエラーが生じる可能性があるので、ドライブ直下に新しく英語名フォルダを作ってその中で解凍するのがいいかもしれません。

(例:Cドライブ直下に「AI」という名前の新しいフォルダを作り、その中で 7z ファイルを解凍)

HDDよりもSSD上で動作させた方が高速に動くので、ディスク容量に余裕がある場合はSSDドライブに解凍してください。

 

モデルあり(上)の方をダウンロードした方はそのまま次の手順にお進みください。

モデルなし(下)の方をダウンロードした方はモデルを旧ソフトから持ってくる必要があるので以下の手順をクリックして開き、ご確認ください。

モデルなし(下) でのモデル移行手順 (クリックして開く)

前バージョンの NMKD Stable Diffusion GUI のフォルダ内にある .ckpt ファイルを 1.6.0 のフォルダの方に持ってきます。

(拡張子 .ckpt のファイルが Stable Diffusion の動作に必要なモデルファイルです)

例えば前バージョンのソフトをインストールした場所が「C:\AI\SD-GUI-1.5.0」なら、

C:\AI\SD-GUI-1.5.0\Data\models\stable-diffusion-1.4.ckpt

をコピーし、1.6.0側で

C:\AI\SD-GUI-1.6.0\Data\models\stable-diffusion-1.4.ckpt

となるようコピーしてください。

つまり新ソフト側の「Data」フォルダ内にある「models」フォルダに、旧バージョンで使っていた .ckpt ファイルを持ってくればOKです。

この作業が終わってからソフトを初回起動します。

 

解凍後、中にある「StableDiffusionGui.exe」を起動します。

NMKD Stable Diffusion GUI 1.4.0 のインストール方法:StableDiffusionGUI.exeの起動
※画像はバージョン1.4.0のもの。1.5.0以降も起動する対象は同じ。

 

NMKD Stable Diffusion GUI が起動して、もし次のようなメッセージが表示されたら「OK」をクリックしてください。自動で Installer画面が起動します。

 

(上記メッセージの代わりに次のようなウェルカムスクリーンが表示されたら右下の「OK」をクリックします。)

NMKD Stable Diffusion GUI 1.4.0 のインストール方法:ウェルカムスクリーン

 

Installer画面を起動します (自動で起動した場合は以下の操作は不要です)

画面右上にある「パソコン画面に下矢印」のアイコンをクリックして Installer 画面を開いてください。

NMKD Stable Diffusion GUI で Installer 画面 を開く方法

 

Installer 画面の下にある「Install」ボタンを押すと、Installation Status でチェックが付いていない未インストールの物がインストールされます。

NMKD Stable Diffusion GUI 1.4.0 のインストール方法:Installer画面

 

後は Stable Diffusion の面倒な環境構築作業を全部ソフトが自動でやってくれます。

インストール途中に追加ダウンロードが発生するため、ネット回線に接続したまま作業してください。

一応ソフトの左下にインストール作業の進捗が表示されます(英語)

NMKD Stable Diffusion GUI 1.4.0 のインストール方法:ログ

 

私の環境ではインストール所要時間が1~2分でした。(ネット回線速度に依存します)

インストール完了までは放っておいて大丈夫なのでPCから離れても問題ありません。

 

全てのインストール作業が終わると再び Installer の画面が表示されます。

画像のようにインストールが必要な項目全てにチェックが入っていればインストール完了です。

右上の×ボタンを押して閉じてください。

NMKD Stable Diffusion GUI 1.4.0 のインストール方法:インストール完了時のInstaller画面

インストールが上手くいかなかった場合…

インストール時に発生するエラー一覧とその対処法についてこちらにまとめたのでご参照ください。

※本ページのコメント欄にインストール時に出たエラーメッセージや、インストールが止まったタイミングなど詳細を記載していただければ原因が特定できるかもしれません。

解決は約束できませんが、調べられる範囲でお調べします。(現在、私用で時間が足りないので対応できない場合があります。ご了承ください。)

 

動作チェック

まず、入力ボックスに適当なプロンプト 例:「sitting calico cat」(座っている三毛猫)を入力し、ソフト右下の「Generate!」ボタンをクリックして画像生成を始めてください。

NMKD Stable Diffusion GUI 1.6.0 の初回動作チェック。プロンプトの入力欄

NMKD Stable Diffusion GUI の 画像生成の方法(基本的な手順)

 

そして 2~3 分ほど待機します。

(初回実行時のみ画像生成に時間がかかります。通常は数秒~十数秒で生成できます)

画像生成に成功するとプレビュー画面に生成された画像が表示されます。

NMKD Stable Diffusion GUI 1.6.0 の初回動作チェック。画像の生成結果

これで動作チェック完了です ฅ/ᐠ˶>ω<˶ᐟ\ฅ

(生成させて気づいたのですが、AI生成の三毛猫さんは茶色の毛が結構オレンジ系の色で表示されがちですね…。プロンプトの工夫が必要そうです。)

 

ソフトの使い方 (初めて使う方向け)

※ 1.6.0 の新機能を知りたい方はこの項を飛ばして次の項にお進みください。

基本的な使い方・設定

初めて NMKD Stable Diffusion GUI を使う方は基本的な使い方各設定項目の意味や推奨値基本機能など一通りまとめた以下のページを必ずご確認ください。

使い方

入力したテキストから画像を生成したり、自分が描いた落書きに説明テキストを加えれば思い通りの絵に変えたりできるAI「Stable Diffusion」 ↑a sleeping cat in the hot spring (温泉で眠る[…]

 

楽しい機能たち

ラクガキを絵画や風景写真に変える

画像(+説明文章)から画像を生成する(img2img)を使ってみたい! という方は以下のページをご覧ください。

MSペイントで描いた適当な山と川の落書き(左)と、それをStable Diffusionのimg2imgに複数回通し、写真風に変換したもの(右)

img2imgのやり方

画像生成AI「Stable Diffusion」は入力したテキストから画像を生成するだけでなく、画像と説明テキストを入力すればそこから思い通りの画像を生成できる img2img も利用できます。 例えばMSペイントで描いたこん[…]

 

画像の高画質化・顔修復・シームレス素材化

NMKD Stable Diffusion GUI 1.3.0 の新機能:顔復元(Face Restruction)

画像の高画質化

画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」が 2022/09/06 についにバージョン更新…! バージョン1.3.0 になりました。そしてバ[…]

 

アニメ風など他の色々なモデルの使用・重み付きプロンプト

Waifu Diffusion モデルで生成したイケメンにゃんこキャラクターの画像

NMKD Stable Diffusion GUIで重み付きプロンプトを使用して生成した写真の比較

アニメ風モデルを使う

画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」で利用可能な便利機能をまとめました。 プロンプト中の語句に数値で重み付けできたり Creative[…]

 

画像の一部分だけ描き変え

画像の一部だけAI変更

画像生成AIの「Stable Diffusion」をコマンド操作不要で簡単に使えるソフト「NMKD Stable Diffusion GUI」が 2022/09/20 に大型アップデートしました! 現在の最新版がバージョン 1.4.0[…]

 

ネガティブプロンプトで画像から不要な要素を除外

ネガティブプロンプト

画像生成AIの「Stable Diffusion」をコマンド操作不要で簡単に使えるソフト「NMKD Stable Diffusion GUI」が 2022/10/04 にアップデートしました! ※現在の最新版はバージョン 1.6.0 […]

 

動物キャラ生成用モデルでかわいいマスコットキャラを作る

Stable Diffusion で furry_epoch4.ckpt モデルを使って生成したかわいい動物キャラ(ケモノ)の画像たち

動物キャラの作り方

画像生成AIの「Stable Diffusion」で人間キャラクターを作成した例はたくさん見かけますが、動物キャラクターは情報が非常に少ないのでこちらに方法をまとめました。 かわいい動物キャラクター・マスコット・ケモノキャラを生成させ[…]

Stable Diffusion で furry_epoch4.ckpt モデルを使って生成したかわいい動物キャラ(ケモノ)の画像たち

 

以下、本ページではバージョン1.6.0の新機能に絞って概要や使い方を説明していきます。

 


 

プロンプト強調構文

概要・使い方

  • (括弧) で囲った語句は強調度合いが大きくなる
  • {中括弧} で囲った語句は強調度合いが小さくなる
  • 括弧や中括弧は任意個数重ねて (( ))  {{ }}、効果を増強できる 
  • 一つのプロンプト内に括弧や中括弧は複数箇所使用可能
  • 括弧の中には単語だけでなく複数語入れてもOK

 

例として雲が浮かぶ青空の写真を生成させ、雲の量を強調構文でコントロールしてみます。

強調前のプロンプトは次のとおりです。

photo of blue sky with clouds

"photo of blue sky with clouds" -s 50 -S 1463371648 -W 512 -H 512 -C 7.5 -A k_euler_a ※使用モデルは Stable Diffusion v1.4

(括弧) で強調を強める

雲の量を増やすため、( ) で clouds を囲って強調してみます。

  1. photo of blue sky with (clouds)
  2. photo of blue sky with ((clouds))
  3. photo of blue sky with (((clouds)))

NMKD Stable Diffusion GUI のプロンプトの強調構文の比較画像:括弧で強調

プロンプト中の clouds を ( ) で強調するほど、生成画像も雲が強調されより多くの雲が表示されました。

{中括弧} で強調を弱める

次に { } で clouds を囲って強調を弱め、雲がどうなるか見てみます。

  1. photo of blue sky with {clouds}
  2. photo of blue sky with {{clouds}}
  3. photo of blue sky with {{{clouds}}}

NMKD Stable Diffusion GUI のプロンプトの強調構文の比較画像:中括弧で強調抑制

確かにプロンプト中の clouds を { } で弱めるほど生成画像も雲が少し減っているみたいですが、強めたときに比べて変化はあまりありません。

中括弧は強調度合いをあくまで弱めるだけで画像から要素を排除するわけではないので、要素を "除外する" というよりは "控えめに出す" という認識が良いと思います。

「ある要素を画像の中に入れておきたいけど、強調度合いは他の要素より弱めで良い」という場合に 中括弧 { } を使うのが良いかもしれません。

今回は雲以外の要素が青空しか無いため、雲を相対的に控えめに出してもあまり大きな差は出ませんでした。

 

他の構文との違い・使い分け

ネガティブプロンプト [ ] と 強調弱め { }

大かっこ [ ] でネガティブプロンプトに指定した要素は含まれないよう除外される一方、中括弧 { } で強調弱めに指定した要素は画像中にちゃんと含まれ、画像の中の他の要素に対して相対的に控えめになるだけです。

例えばネガティブプロンプトに clouds を指定します。

photo of blue sky [clouds]

"photo of blue sky [clouds]" -s 50 -S 1463371648 -W 512 -H 512 -C 7.5 -A k_euler_a

先ほどと同一シード・同一設定ですが雲は完全に消え、代わりに別の要素が現れました。

※通常のプロンプト文とネガティブプロンプト文は別枠であり、通常プロンプトから clouds が無くなったことで構図も大きく変わっています。

このように要素を完全に排除したい場合はネガティブプロンプト [ ]  を使うのが良いですが、既存の生成済み画像から要素を排除するためにネガティブプロンプトを使おうとするとプロンプト文自体が変わるので構図も変わってしまいます。

構図はそのままに要素の排除を行いたい場合はネガティブプロンプトの代わりに重み付きプロンプトを使用します。

重み付きプロンプト と 強調弱め { }

重み付きプロンプトは各語句の強調度合い(重み)を数値で指定できる機能です。

※詳しい使い方は以下で説明しています。コロン :  で語句の後ろに重み数値を付け足すだけです。

重み付きプロンプトの使い方

画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」で利用可能な便利機能をまとめました。 プロンプト中の語句に数値で重み付けできたり Creative[…]

 

それでは、構図はそのまま維持しながら雲量だけ調整するために各語句に重みを割り当ててみます。

  1. photo of blue sky with clouds
  2. photo of blue sky:1 with clouds:0.1
  3. photo of blue sky:1 with clouds:-0.25
  4. photo of blue sky:1 with clouds:-0.3

NMKD Stable Diffusion GUI の重み付きプロンプトの比較画像

重みにはマイナスの値も指定することができます。

正の値では小さくしても「要素を控えめにする」ぐらいの効果ですが、負の値にすれば「要素を除外する」効果も現れ最終的にほとんど雲を消すこともできています。

 

一方で、24 個もの大量の中括弧 { } で clouds を控えめにした生成結果はこちらになります。

photo of blue sky with {{{{{{{{{{{{{{{{{{{{{{{{clouds}}}}}}}}}}}}}}}}}}}}}}}}

"photo of blue sky with {{{{{{{{{{{{{{{{{{{{{{{{clouds}}}}}}}}}}}}}}}}}}}}}}}}" -s 50 -S 1463371648 -W 512 -H 512 -C 7.5 -A k_euler_a

大量に中括弧を重ねたとしても、重みで 0.1 を指定したときに比べて雲量は多いです。

これ以上中括弧の数を増やしても生成結果はほぼ変わりません。

このように中括弧では要素の除外は難しいので(そもそも中括弧の用途外)、このような場合は重み付きプロンプトを使用するのが良いと思います。

ちなみに雲量を増やすために clouds の重みを 1 より大きくすることも可能です。

重み付きプロンプトを使う場合は数値で細く指定できる点がメリットになります。

※ただ、場合によっては語句の重み指定がうまく作用してくれなかったり画像中の各要素の形状や色調がおかしくなってしまうこともあるので、結局簡単な中括弧 { } を重みの代わりに使った方が良い場合もあります。

 

モデルファイルのクイック切り替え

Ctrl+M のショートカットキー → 矢印キーでモデル選択 → Enter で確定

 

ソフト画面で Ctrl + M のショートカットキーを押すとモデルのクイック切り替えメニューが現れます。

NMKD Stable Diffusion GUI のモデルファイル切り替え

 

矢印キーでモデルを選択し、Enter を押せば使用モデルが切り替わります。

モデルを選択するためにいちいち Settings 画面まで移動しなくて良くなったので便利ですね。

 

モデルフォルダマネージャー

モデル保存先フォルダが任意個数登録可能になりました。

モデルをどこか共通のフォルダに保存しておけば、今後 NMKD Stable Diffusion GUI の新バージョンを入れたときにいちいちモデルをコピーして移し替えなくても良くなります。

NMKD Stable Diffusion GUI 以外の Stable Diffusion 環境を使用している場合もモデルファイルを共用できるのでディスクスペースの節約になります。

手順

画面右上の歯車マークのボタンから Settings 画面に移動します。

設定項目 Stable Diffusion Model File のところの右端にあるボタン「Folders...」をクリックします。

NMKD Stable Diffusion GUI のモデルフォルダマネージャーの使い方:開き方

 

モデルフォルダ登録画面になりました。

右上にある「+」ボタンを押すとフォルダ選択画面になるので、モデルの保存先フォルダを開いて追加してください。

NMKD Stable Diffusion GUI のモデルフォルダマネージャー画面

 

下のリストにフォルダが登録されればOKです。

登録済みのフォルダ内にある モデル (.ckpt ファイル) がソフトのモデル選択機能で選べるようになります。

NMKD Stable Diffusion GUI のモデルフォルダマネージャーの使い方:フォルダ追加後

 

なお、下のリストでフォルダを選択してから「-」ボタンを押せば登録解除、フォルダボタンを押せば該当フォルダのエクスプローラーでの表示ができます。

 

ポップアップ画像ビューア

ソフト画面でプレビュー画像をクリックすると画像ビューアがポップアップ表示されます。

この画像ビューアを閉じるには Esc キー を押せばOKです。

メニュー項目

画像ビューアの右クリックで各機能を呼び出すことができます。

NMKD Stable Diffusion GUI のポップアップ画像ビューア

Close (ESC) 画像ビューアを閉じる
※Escキーを押して閉じることもできる
Copy Image to Clipboard 画像をクリップボードにコピーする
Set Tiling... 画像をタイル表示 (1x1, 2x2, 3x3)
※Generate Seamless (Tileable) Images オプションをONにしてシームレス画像を作っている場合は、この機能で画像ビューアから簡単に2×2、3×3でタイリングしたときの表示を確認できます
Enable Slideshow Mode
(Mirror Image Viewer)
ソフト本体の「 < 」「 > 」ボタンで次の画像を表示させた時、画像ビューアもソフト側と同じ画像を表示させるかどうか
※これをONにすると、矢印キーで画像の切り替えができるようになります
Always on Top 画像ビューアを常に最前面に表示する
Help ヘルプを表示 (※英語)

キー・マウス操作

マウスのホイール操作 画像の拡大・縮小 (25%刻み)
ダブルクリック 画像の全画面表示
Esc キー 画像ビューアを閉じる
T キー タイル表示の切り替え

 

ショートカットキー

キー 機能
Ctrl + G 画像生成を実行 / 画像生成中なら生成をキャンセル
Ctrl + M モデル切り替え
Ctrl +「+」 プロンプト入力欄の大きさを切り替え
Ctrl + Delete 現在表示中の画像を削除
Ctrl + Shift + Delete 現在のバッチで生成された全ての画像を削除
Ctrl + O 現在表示されている画像を開く
Ctrl + Shift + O 現在表示されている画像のあるフォルダを開く
Ctrl + V クリップボードの画像を貼り付け
Ctrl + Q 終了
Ctrl + ホイールスクロール プロンプト入力欄で文字サイズを拡大・縮小
F1 ヘルプを開く
F12 設定画面 (Settings) を開く

 

※バージョン 1.5.0 ではプロンプト入力欄でマウスホイールを回転させることで文字の拡大・縮小ができていましたが、バージョン 1.6.0 からは Ctrlキーを押しながらマウスホイールを回転させる仕様に変わりました。

 

Dreambooth (注:情報不足)

Dreambooth を使えば好きな画像を学習させてオリジナルモデルを作成できるみたいです。

自分の家の猫や自作キャラクターを DreamBooth トレーニングで学習させてモデルファイルを作成し、そのモデルを使って好きな画像を生成できるようになります。

しかし実行環境のハードルが高く、VRAMが24GB以上必要とのこと…。

RTX 4090, RTX 3090 Ti, RTX 3090 をお持ちの方であれば実行できますね! (いいな~)

私の環境ではVRAMが8GBしかなく Dreambooth を実行できません…。

大変申し訳無いのですが以下、公式ドキュメントを参考に説明できる範囲までしか記載していません。

詳しくは公式ドキュメント、または誰かの実行例をご参照ください。

 

公式ドキュメント

GitHub

Somewhat modular text2image GUI, initially just for Stable D…

 

システム要件

  • GPU: 24 GB VRAM を搭載した Nvidia GPU、Turing アーキテクチャ (2018) 以降
  • RAM: 32 GB の RAM
  • ディスク: NVME SSD に 12 GB (一時ファイル用に別の空き 30 GB を推奨)

大量のVRAMを消費するため、DreamBooth トレーニング実行中は他のアプリやゲームを閉じてください。

24 GB 全てを使用できないとトレーニング速度が大幅に低下するみたいです。

※VRAM が 24 GB に満たない環境で無理矢理実行しようとしても、以下のような警告メッセージが出て DreamBooth を実行できません。

「お使いのGPUは 8 GB VRAMですが、DreamBooth トレーニングには現在 24 GBが必要です」

 

トレーニング方法

訓練用画像の準備

訓練用の画像は4~20枚が推奨で、量より質と念押しされていました。

画像サイズは512×512pxに調節してください。

訓練させたいキャラクターや物をさまざまなポーズやシナリオで表現した画像を使用してください。

背景にもバリエーションがあったほうが良いようで、全画像の背景が真っ白だとモデルが別の背景を生成するのが難しくなるみたいです。

<良くない画像の例>

  • 低画質の画像
  • 訓練対象の被写体がはっきりしない乱雑な画像
  • 変わったポーズ

DreamBooth 画面を開く

ソフト右上の赤枠で囲ったボタンをクリックし、メニューから Train DreamBooth Model をクリックします。

NMKD Stable Diffusion GUI でDreamBoothで好きな物やキャラクターを訓練させる方法

 

DreamBooth の画面が開きました。

NMKD Stable Diffusion GUI でDreamBoothで好きな物やキャラクターを訓練させる方法:DreamBooth画面

各設定を調整する

Base Model (Train on Top of This)

ベースとするモデルの選択です。

テンプレートとして使用するモデルを設定します。訓練対象の新しいキャラクターや物が選択したモデルの中に追加されます。

モデルは 4 GB 級の float-32版 の.ckpt ファイルが推奨されています。

( "full-ema" 版でも動作しますが、float-32版を超えるメリットは無いようです。また、2 GB 級の float-16版モデルも使用できるみたいですが、品質が若干低下する可能性があるようです)

Training Preset

訓練プリセットの選択です。

訓練には本来様々な設定値を手動で調整する必要があるのですが、操作を簡単にするために開発者さんが調整済みの設定(プリセット)をいくつか用意してくれています。

Quality (品質) が高いプリセットほど生成するモデルの質が高くなる一方、訓練自体に時間がかかります。

最も良い品質のプリセットが推奨されています。

プリセット名 訓練ステップ数 補足
Very High Quality 4000 ※RTX 3090 で所要時間 約80分
High Quality 2000 2倍の学習率で補う
Medium Quality 1000 4倍の学習率で補う
Low Quality 250 16倍の学習率で補う
Training Images Folder

訓練用画像の入ったフォルダを指定します。

※画像サイズが512×512pxであることを再度ご確認ください。

Class Token (Override This Class)

クラストークン (学習させた物やキャラクターをプロンプトで入力するときの名前) を指定します。

例えば自分の家のサバトラにゃんこを学習させるのであればクラストークンに「silver tabby cat」と指定すれば、作成したモデルファイルを使うときにプロンプト中で「silver tabby cat」と入力することで自分の家のサバトラにゃんこが出てくれます。

※実際に試していないのでクラストークン中に半角スペースが使えるか確認できていません。もし使えなかったらすみません…!

 

既存のキャラクターを学習させる場合は、ベースとするモデルで既に認識されているキャラクター名をクラストークンに指定した方が良いみたいです。

例えばニャースのイラストで学習させる場合、適当に nya-su をクラストークンにするよりも meowth (ニャースの正式な英語名) をクラストークンにした方が良いみたいです。

(ベースとするモデルである程度訓練されているキャラなら、それを今回の追加訓練のベースにした方が品質が良くなるのかな)

注意として、クラストークンに man や person といった汎用的な名詞を使用するとプロンプトでそれらの語が (今回学習させたキャラを生成させる目的以外で) 使えなくなってしまいます。

Learning Rate

※通常は Normal 設定で良いみたいですが、学習したモデルが正しくデータを学習していないようであればこの値を大きくしてみてください。

Learning Rate が高すぎるとオーバーフィットしてしまい訓練画像とほぼ同じ画像しか出力できない柔軟性に欠けるモデルになってしまったり、視覚的な品質が低下してしまったりする場合があるようです。

訓練の開始

設定が終わったら、画面左下の「Start Training」ボタンを押して訓練を開始してください。

訓練が終わるとモデルファイル (.ckpt) が生成するのでこれからの画像生成で利用できます。

パソコン相談も受付中(*・ᴗ・*) よろしければフォローお願いします(懇願)