NMKD Stable Diffusion GUI 1.3.0 の新機能・導入/更新方法

画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」のバージョン 1.3.0 / 1.3.1 から搭載されている機能の説明ページです。

現在はより新しいバージョンが公開されているため、以下の説明も最新版のソフトに合わせて適宜修正しています。

なおソフトの概要・詳しい使い方に関しては以下のページをご参照ください

StableDiffusionGUIの使い方

入力したテキストから画像を生成したり、自分が描いた落書きに説明テキストを加えれば思い通りの絵に変えたりできるAI「Stable Diffusion」 ↑a sleeping cat in the hot spring (温泉で眠る[…]

 

 追記:より新しいバージョンが公開されたので情報を追加しました

現在は新バージョン(1.4.0 / 1.5.0 / 1.6.0 / 1.7.0 / 1.8.0 / 1.9.1)が公開され、機能も更に追加されています。

他のバージョンの追加機能を確認したい場合は以下のページをご覧ください。(画像クリックで該当ページに移動できます)

NMKD Stable Diffusion GUI 記事一覧

 

Ver. 1.2.0 → Ver 1.3.0 の変更点

※以下要点です。詳しい公式発表はこちら。沢山の新機能が追加されて嬉しい!ฅ/ᐠ˶>ω<˶ᐟ\ฅ

変更点の一覧 (クリックして表示)

動作可能環境の拡大

  • 少ないVRAM使用量で動作するオプションが追加。VRAM 4GB でも512×512画像が生成可能に
  • 既に conda環境がPCに入っている場合も競合せずインストール可能に
  • 一部グラボで生成画像が緑一色・黒一色になる問題の解決が可能に
    ↑Use Full Precision (VRAM-heavy)  オプションが機能しない不具合が解消したため。

新機能の追加

  • 生成する画像の高画質化(アップスケーリング)機能が追加:Upscalling
  • 生成する画像中の顔面修復機能が追加:Face Restoraction
  • タイル状に並べても継ぎ目が分からないようなシームレス画像の生成機能
    ↑ソフトの画像プレビュー画面で2×2、3×3に並べた画像をその場でプレビュー可能
  • 一度に複数のプロンプトを実行可能に (プロンプトを改行で複数入力)
  • プロンプトごとに画像をサブフォルダーに保存するオプション
  • 画像の保存フォルダが変更可能に

※アップスケーリングは Real-ESRGAN、顔復元は GFPGAN のものです。これらがコマンド操作無しで使えるようになる神アプデです。

不具合修正・改善

  • 最適化によりVRAM 使用量をわずかに削減 (高速化)
  • 一部のディスプレイでソフト画面が崩れる問題の修正 (DPI スケーリングの破損問題)

 

Ver 1.3.0 → Ver 1.3.1 の変更点

新機能の追加

  • 設定画面から使用するモデルファイル(.ckpt)を選べるようになった
    ↑複数のモデル (標準のStable Diffusion, Waifu Diffusion, …) の切り替えが容易に
  • 生成画像プレビューウィンドウで、右クリックメニューから画像をコピーできるようになった

不具合修正・改善

  • VRAM消費量が改善されたみたいで、今までよりも若干大きなサイズでも画像を生成できるようになった
  • 初回起動時に画像がいつまで経っても生成されない不具合が解消された(みたい)
  • 低VRAMモードがONになっていると img2img が機能しない(Init Image Strength の設定値が何であれ、入力画像とは全く異なる画像が生成されてしまう) 問題が修正された
  • 配布時の圧縮形式が .zip から .7z 形式に変更。それに伴いダウンロード時のサイズが 3 GBから 2 GB に大幅削減
  • アップスケーリングや顔復元の設定ボタンが右上に移動

マイナーアップデートですが、パフォーマンス改善やバグの修正が行われており利便性が向上しています。時間に余裕がある方は 1.3.1 も入れてみてください。

動作条件

※最新版の動作条件はこちらをご覧ください。

ソフトのインストール・更新方法

2023/3/6 追記:現在の最新バージョンのインストール方法はこちらのページに記載しています。

ソフトの使い方

※初めて NMKD Stable Diffusion GUI を使う方はまずは上記リンク先を見て、基本的な使い方を先にご確認ください。

なお、画像(+説明文章)から画像を生成する(img2img)のやり方はこちらです。

MSペイントで描いた適当な山と川の落書き(左)と、それをStable Diffusionのimg2imgに複数回通し、写真風に変換したもの(右)

img2imgのやり方

画像生成AI「Stable Diffusion」は入力したテキストから画像を生成するだけでなく、画像と説明テキストを入力すればそこから思い通りの画像を生成できる img2img も利用できます。 例えばMSペイントで描いたこん[…]

 

以下、本ページではバージョン1.3台で追加された新機能に絞って概要や使い方を説明していきます。
なお、ソフト画面は最新版のものに適宜差し替えています


 

プロンプトの複数入力&実行

プロンプトは一度に複数行入力して、複数個を順次実行できます

NMKD Stable Diffusion GUI のプロンプト複数行入力

例えばこのように3つのプロンプトを入力すると、各プロンプトごと指定枚数の画像が生成されます。

(画像生成枚数を 5 枚にすると、各プロンプトごと 5 枚ずつ画像が生成されます。計 15 枚。)

なおデフォルトの設定では各プロンプトごとに同一のSeed値(連番)で画像が生成されます。

純粋にプロンプトの差による影響だけを見られるので便利です。

 

  • プロンプトに少しずつ変更を加えたバリエーションを用意して、生成する画像を比較したい場合
  • 実行したい数十個のプロンプトを夜寝る前に一括で入力しておき、それぞれ100枚ほど自動で生成させておきたい場合

などに役立ちます。

 

シームレス画像の生成機能

タイル状に並べても継ぎ目が分からないようなシームレス画像を生成させることができます。

背景テクスチャや壁紙の作成にピッタリです。素材作りが捗りそう。

 

試しに今回はレンガの背景テクスチャを作成しようと思います。

プロンプトは「brick wall texture」と入力しました。

プロンプト入力後、「Generate Seamless (Tileable) Images」の項目で、シームレスになる(継ぎ目がなくなる)方向を指定します。

NMKD Stable Diffusion GUI のシームレスモード設定

Disabled 無効 (機能OFF)
Seamless on All Sides 縦横両方シームレス
Seamless on Left/Right Edges 横方向のみシームレス
Seamless on Top/Bottom Edges 縦方向のみシームレス

今回はレンガ画像を平面に敷き詰めたいので、「Seamless on All Sides」(縦横両方)を選択します。

 

この設定で生成された画像がこちらです。

NMKD Stable Diffusion GUI 1.3.0 で作成したシームレスなレンガのテクスチャ素材

この画像を4枚並べると…

 

NMKD Stable Diffusion GUI 1.3.0 で作成したシームレスなレンガのテクスチャ素材を4枚並べたもの

このように継ぎ目なく並べることができます。

同じ画像を繰り返し配置したい場合は、このようなシームレス画像がとても便利です。(素材にピッタリ)

※レンガや壁紙などの素材画像は縦横両方シームレスで大丈夫ですが、人物を入れると縦横シームレスで造形がとんでもないことになりがちです。
↑その場合は横方向のみシームレスにしてみてください。(横にしか並べられなくなりますが)

敷き詰めた場合のプレビュー

画像を 2×2、または 3×3 枚で敷き詰めた場合の見え方をその場でプレビューできる機能があります。

ソフトのプレビュー画像をクリックすると画像がポップアップで表示されますが、それを右クリックしてください。

NMKD Stable Diffusion GUI のシームレス画像のタイリングプレビュー

Set Tiling...」メニューから 2x2 または 3x3 のプレビュー表示が可能です。

 

生成する画像の高画質化 (アップスケーリング)

例えば 512×512 サイズの生成画像を、縦横2倍の 1024×1024 サイズ、縦横3倍の 1536×1536 サイズ、または 縦横4倍の 2048×2048 サイズに拡大することができます

(Real-ESRGAN によるアップスケーリングがコマンド操作不要で実行可能)

NMKD Stable Diffusion GUI 1.3.0 の新機能:アップスケーリング

左:512×512 サイズで生成したねこさんのおかおをズーム
右:2048×2048 サイズにアップスケーリングした左の画像

※Webサイトにアップするために画質を落としてしまったので、右の画像は本当はもっと精細です。

Stable Diffusion で生成させた画像がせっかく良さげでもサイズが 512×512 だと小さくてどうしても使える場面が限られてしまう… なんて悩みも解消されます。

設定手順

ウィンドウ右上の 魔法ステッキボタンをクリックします。

NMKD Stable Diffusion GUI の Post-Processing (後処理) ボタン

 

Upscaling」の項目にある「Run Upscaling for Every Generated Image」(生成した各画像にアップスケーリングを実行する) のチェックボックスを ON にします。

画像の Upscaling Factor (アップスケーリング倍率) は「2x」「3x」「4x」から選べます。

NMKD Stable Diffusion GUI のUpscallingの設定方法

この Post-Processing 画面を閉じれば設定完了です。

以後に生成される画像は指定した倍率で毎回アップスケールされるようになります。

Upscaling Strength について

設定画面の「Upscaling Strength」はアップスケールの補正強度です。

アップスケーリングは単純に画像サイズを拡大するだけではなく、拡大により本来粗くなるはずの画質を補正してなめらかにします。

基本的に 1 (最大) で問題ないですが、強度が大きいほどなめらか補正が強くなります。

※強度を下げた方が良い例:レンガなど元々ざらざらした質感の画像のアップスケーリング
↑強度最大だとレンガのザラザラした質感が失われてなめらか高画質になってしまいます

必要なときだけアップスケーリングする

上記設定だと生成画像が常にアップスケーリングされるので、画像生成後に特定の画像だけアップスケールしたい場合は次の方法を代わりに用いてください。

まず、必要なときだけアップスケーリングする場合は「Run Upscaling for Every Generated Image」のチェックボックスを OFF にします。

 

画像生成後、生成した画像をソフト画面で右クリックして「Post-Process Image...」を選びます。

 

Apply Upscaling」を選べば、今表示している画像をアップスケーリングした画像が同じフォルダに出力されます。

この方法で同様に顔復元(Face Restoration)、両方(All) の実行も可能です。

アップスケーリング前/後の画像を両方保存したい

Settings 画面の設定から可能です。

ソフト画面右上の歯車ボタンから Settings 画面に移動し、下の方にある次の設定のチェックボックスをONにしてください。

When Post-Processing Is Enabled, Also Save Un-Processed Image
「画像の後処理が有効なとき、処理前の画像も保存する」

アップスケーリングをかける前と後の両方の画像が保存されるようになります。(顔復元をやっている場合も同様)

 

生成する画像中の顔面修復機能 (顔復元)

生成画像中に含まれる人の顔を修復し、不自然なところや低画質でぼやけてしまっているところを綺麗にしてくれます

NMKD Stable Diffusion GUI の機能:顔復元(Face Restruction)の適用前と適用後
プロンプト:smiling child face facing forward Face Restruction Strength の値は 1

左が顔復元が適用される前、右が顔復元適用後です。

変になっていた目の部分や不自然な歯の形が修正され、自然になりました。

顔は特に不自然な部分が目立ちやすいので、それを顔復元で少しでも軽減できるのは大きいですね。

人物写真をよく生成する人には重宝しそうな機能です。

(GFPGAN による顔復元がコマンド操作不要で実行可能という機能)

設定手順

ウィンドウ右上の 魔法ステッキボタンをクリックします。

NMKD Stable Diffusion GUI の Post-Processing (後処理) ボタン

 

Face Restoration」の項目にある「Run Face Restoration for Every Generated Image」(生成した各画像に顔復元を実行する) のチェックボックスを ON にします。
(※後から手動で顔復元する場合はONにせず大丈夫です)

NMKD Stable Diffusion GUI のFace Restorationの設定方法

この Post-Processing 画面を閉じれば設定完了です。

以後に生成される画像は毎回顔復元が実行されるようになります。

Face Restoration Method について

顔復元には現在2種類の Method (方法) があります。(GFPGAN と CodeFormer)

基本的に GFPGAN の方が修復精度が良いので変更は不要ですが、両者の違いが気になる方はこちらのページで比較したので参考にしてください。

Face Restoration Strength について

顔復元の強度です。

値が大きいほど補正効果が強くなりますが、顔が変わってしまう可能性も高まります。( 0 ~ 1 の範囲)

推奨値は 0.5~0.8 です。(←参考)

より詳しい設定方法について

設定値に応じた復元の程度比較や、追加の設定などについては以下のページに詳しく記載しているのでそちらをご確認ください。

顔復元の詳細

画像生成AIの「Stable Diffusion」をコマンド操作不要で簡単に使えるソフト「NMKD Stable Diffusion GUI」のバージョン 1.5.0 から搭載されている機能の説明ページです。 現在はより新しいバージョ[…]

対象の顔について

人物の顔だけが対象です。

動物(ねこなど)の顔はそもそも認識されないため、顔復元機能が働かず修復前・修復後で画像が同じになります。

二次元キャラクターも対象外です。

また生成した人物の顔が一部しか写っていないと顔認識されず、顔復元が働かないことがあります。

 

アップスケーリングと顔復元の併用

UpscalingFace Restoraction の両処理を同時に使用することもできます。

内部処理としてはまず先に画像のアップスケーリングが行われ、次に顔復元が実行されます。

 

 

※ 以下、バージョン1.3時代の古い情報なので注意


ソフト設定画面

クリックして情報を表示

Ver 1.3.0 / 1.3.1 で共通の項目

バージョン 1.3.0 で設定項目が大幅に追加されました

ウィンドウ右上の歯車アイコンのボタンが設定ボタンです。

 

NMKD Stable Diffusion GUI 1.3.0 のソフト設定画面

Low Memory Mode

注意:VRAM 8 GB 未満の GPU のための設定

ONにすると VRAM が少ない環境でも画像生成が実行できるようになりますが、以下の機能が無効化されます。

  • シームレス画像の生成機能
  • Samplerの選択
  • Post-Processing (アップスケーリング・顔復元)

画像サイズが大きいとき「Generated 0 image」と表示されて何も画像が生成されない事例が頻発しているなら、チェックをONにすれば画像が生成できるようになると思います。

VRAM容量が 4GB 程しか無い場合はこちらの設定をONにすることを検討してください。

※この設定をONにしたところ VRAM 4GB の GPU で 704x640 の大きな画像の生成に成功したという報告がありました。(リンク)

Use Full Precision (VRAM-heavy, Mostly Useless)

ONにするとVRAMを大量に消費するようになるため、OFF推奨です。

Geforce GTX 1660 (Super / Ti) をお使いの場合、不具合で生成される画像が緑一色or黒一色になる事例がありますがその場合はこちらの設定をONにすると直る可能性があります。

Image Output Folder

生成した画像の出力先フォルダが設定できます。

(※日本語を含むフォルダ・半角スペースの入ったファイルパス・長すぎるファイルパスに対応しているかどうか不明)

Create a Subfolder for Each Prompt

ONにするとプロンプト文の種類ごとにフォルダが作成され、各プロンプトごと別のフォルダに画像が保存されます

NMKD Stable Diffusion GUI 1.3.0 の新機能:プロンプト別にフォルダを生成

例えば「adorable cat」「cute cat」「kawaii cat」の3つのプロンプトを実行したら、上記画像のようにちゃんとプロンプトごとにフォルダが作成され画像はそれぞれその中に入ります。

同じプロンプト文を実行したのなら後日でもちゃんと当該フォルダに画像が出力されます。

Include Prompt in Filename

ONにすると生成した画像ファイル名にプロンプト文が含められます。(ファイル名が長大になるので注意)

When Running Multiple Prompts, Use Same Starting Seed for All of Them

「複数のプロンプトを実行時、それら全てで同じ開始シード値を使う」設定。

ONにすると各プロンプトで使用シード値が共通になります。

Advanced Mode (Unlock Higher Values for Sliders)

上級者モード。

画像生成時の各設定項目のスライダーの上限値が大きく解放されます。

設定項目 OFFのときの上限 ONのときの上限
Detail (Steps) 120 500
Creativeness 25 50
Resolution 1024 1536

どれも値を上げすぎると不都合が生じる設定ばかりなので、大抵は上級者モードOFFでも問題ありません。

でも120以上のステップ数が設定可能になったのは良いかも!

VRAM潤沢勢ならリッチに1536×1536サイズの大きな画像を生成できるようになります。

 

Ver 1.3.1 で追加された項目

Stable Diffusion Model File

画像生成に使用するモデルファイル(.ckpt)設定画面から自由に変更できるようになりました

標準の Stable Diffusion のモデル以外も利用している場合 (Waifu Diffusion など) は簡単にモデルの切り替えができるようになるので大変便利です。

切り替えの手順は以下の通りです。

  1. Open Folder ボタンを押し、開かれたフォルダ画面に別モデルの .ckpt ファイルを入れる
  2. 一度 Settings 画面を閉じて、再度開く (モデル一覧を更新させるため)
  3. モデル名が表示されているボックスをクリックすると、先ほどフォルダに入れた .ckpt ファイルが選択肢に表示されるようになっている

 

他のモデルのダウンロード先はこちらのページに記載しています。

別モデルの利用

画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」で利用可能な便利機能をまとめました。 有志が作成した色々なオリジナルモデル(アニメイラスト特化、特[…]

 

バージョン 1.3.0 の既知の不具合

クリックして情報を表示

reddit のこちらのページで報告されていた不具合です。

開発者さんが数日後にバグ修正版を公開すると言っていたので、そのうち修正されるかもしれません。
1.3.1 でいくつか修正されました。

(1.3.1 で修正済) 生成した画像がどこにも保存されない

初回実行時、緑のリングがぐるぐる回るだけでいつまで経っても画像が生成されない不具合が発生する場合があります。

本ページの「★初回実行時の不具合修正用手順 (Ver 1.3.0 では必須)★」に従って不具合を修正してください。

(1.3.1 で修正済) 画像ファイルの拡張子が大文字になっていると "Invalid image type" と表示され画像が読み込めない

対処法:img2img時に読み込む画像の拡張子(.JPG, .PNG, .GIF)は小文字にする (.jpg, .png, .gif)

参考リンク

Step数が多いとエラーが出て実行できないことがある

IndexError: index 1000 is out of bounds for dimension 0 with size 1000

のようなエラーが出て img2img が実行できない現象が発生することがあるみたいです。

対処法:Step数の変更。(少ない値にする)

参考リンク

ユーザーファイルパスにアポストロフィが含まれていると、Use as Init Image が機能しない?

参考リンク

記事化前の最新情報はこちらで先にツイートしています。サイト更新告知もこちら。