Stable Diffusionのimg2img(画像から画像)をソフトから簡単に実行 [NMKD Stable Diffusion GUI]

画像生成AI「Stable Diffusion」は入力したテキストから画像を生成するだけでなく、画像と説明テキストを入力すればそこから思い通りの画像を生成できる img2img も利用できます。

Stable Diffusionのimg2imgで使うために適当にMSペイントで描いた山と川の絵

例えばMSペイントで描いたこんな適当な落書きにプロンプトを付けて img2img すれば…

 

MSペイントで描いた適当な山と川の落書きをStable Diffusionのimg2imgを複数回使い、写真風に変換

落書きから写真を生成できます。

この img2img を自分のPC上で、複雑なコマンド操作なしで利用できるソフトとして NMKD Stable Diffusion GUI があり、現在は難しいコマンド入力無しでimg2imgが使えるようになっています。

※ ソフト NMKD Stable Diffusion GUI のインストール方法や使い方は以下ページにまとめたので先にご覧ください

StableDiffusionをインストール

入力したテキストから画像を生成したり、自分が描いた落書きに説明テキストを加えれば思い通りの絵に変えたりできるAI「Stable Diffusion」 ↑a sleeping cat in the hot spring (温泉で眠る[…]

(もちろんimg2imgだけでなく、普通のtxt2img(テキストから画像)もコマンド操作無しで本ソフトから簡単に実行できます。ソフト開発者さんに大感謝!)

以下ソフトがインストール済みの状態で説明を記載します。

2023/03/29追記:ソフトのバージョン更新により本ページの情報が一部古くなっていたので、修正しました。

img2img の方法

まず、元の絵(画像)を用意します。(512×512サイズが推奨)

※とりあえず試してみたいけど元の画像を用意するのが面倒という方は、以下のテキトー画像をご自由にお使いください。

適当にMSペイントで描いた山と川の絵

CC0
Pajoca (パジョカ) はこの作品の全ての著作権および関連する権利をCC0により放棄しています。

 

次に NMKD Stable Diffusion GUI の Prompt 入力ボックスの下にある、「Load Image(s)」ボタンをクリックし、用意した画像を読み込ませます。

なお、クリップボードにコピーした画像を Ctrl + V キーで貼り付けて読み込ませることもできます。(便利。)

NMKD Stable Diffusion GUIでimg2imgを使う方法:画像の読み込み

 

画像読み込み時に次のようなダイアログボックスが現れたら、選択オプションが Load as Initialization Image「初期画像として読み込む」になっていることを確認して OK ボタンを押します。

NMKD Stable Diffusion GUIでimg2imgを使う方法:画像ダイアログボックス

 

画像が正常に読み込まれると、ボタンの隣に読み込んたファイル名が表示されます。
(画像を変えたい場合は「Clear Image」ボタンを押してから改めて画像を読み込んでください)

NMKD Stable Diffusion GUIでimg2imgを使う方法:読み込んだ画像がセットされた

なお表示されているファイル名のところに、Shift キー を押しながらマウスカーソルをホバーすれば今読み込んだ画像をプレビューできます。

 

あとは Prompt に画像の説明文 (画像に写っているものや、どのようなスタイルに変えたいか) を英語で入力し、下の Generate! ボタンを押せば画像の生成が始まります。

NMKD Stable Diffusion GUIでimg2imgを使う方法:プロンプトの入力と画像生成の実行

今回入力したプロンプト (クリックで表示)

a beautiful realistic photo of landscape, green mountains in the background, a river in the center, blue sky and some clouds, canon eos 5d mark iv

※プロンプトもテキトーです。もっと短く単語の羅列にしても大丈夫なのでまずは適当に入力してみてください。

photo of beautiful mountain and river でもOK。

(呪文のコツは検索するといろいろ出てきます! プロンプト検索サイト lexica.art も便利)

 

数秒~数十秒待つと、画像が生成されます。

MSペイントで描いた適当な山と川の落書きからStable Diffusionのimg2imgで風景画を生成

テキトーすぎる落書きが風景画に変わりました!
(※カメラ名をプロンプトに入れると画像のように一部ピンボケ風の領域が現れやすいので注意)

これが基本的なimg2imgの流れです。ただし設定を色々と変えないと思った通りの画像が出てくる割合が相当低くなるので、次に各設定項目について記載します。

落書きを風景画ではなく写真に変換したい場合はもうひと工夫必要なので、以下の設定項目とその次の項をお読みください。

 

img2img の各設定項目

NMKD Stable Diffusion GUIでimg2imgにおける設定項目

 

主要各項目の要点 (ざっくり)

  • Initializaion Image Strength (Influence)元の画像をどれほど維持するか (大きいほど元の画像に近い出力になる)
  • Inpainting:画像の一部分だけを描き変える
  • Amount Of Images To Generate:生成したい画像の枚数
  • Generation Steps:画像生成に費やすステップ数。増やすと画像が変化するが所要時間も増える。
  • Prompt Guidance (CFG Scale):大きくするほど Prompt で指示したテキストに忠実な画像が得られる。
    ※低いほど Prompt に関係ない要素が含まれやすくなるが、その分創造性に富む画像になる
  • Seed:シード値。値が同じなら同一設定で同一画像が出力される。空欄ならランダム。
  • Resolution (Width x Height):生成したい画像のサイズ (幅×高さ)。大きくしすぎるとVRAM不足で画像が生成されないことも。

各設定項目のより詳しい説明や推奨値については以下のページをご参照ください。

StableDiffusionの設定値

画像生成 AI「Stable Diffusion」をコマンド不要で簡単操作で使えるソフト NMKD Stable Diffusion GUI について、ソフト画面と機能・仕様を一覧で説明しています。 こちらのページは機能や設定を一通り[…]

NMKD Stable Diffusion GUI のソフト画面の説明

 

【重要】Initializaion Image Strength (Influence) について

img2img 独自の設定項目です。

img2img 用に読み込んだ画像をどれほど維持しつつ画像生成するかという設定です。

値が 1 に近いほど、読み込んだ元の画像に近い出力になります。

逆に値が小さいと、元の画像と大きく異なる画像が生成する傾向が強まりますが、その分プロンプトがより反映されるようになります。

Initializaion Image Strength の比較画像

 

小さければ元の絵からアレンジされた(元の絵と離れた)ものになるので、テキトーな落書きを良さげに化かすには小さい値のほうがおすすめです。(0.1~0.2 など)

逆に与えた画像を少し Stable Diffusion で修正したいだけの場合は、大きな値に設定しておかないと大胆に変更されてしまいます。

0.1~0.9 までの範囲で調節できます。

ペイントでテキトーに描いた絵を良い感じの写真にしたい
0.15 がおすすめ

 

落書きを写真に変換したい!

プロンプトに photo やカメラ名を入れていても、適当な落書きから生成される画像の多くは写真ではなく絵になってしまいます。

これを写真に近づけていくには、img2img で生成させた画像をもう一度 img2img に入力して再度画像を生成させるのが一番簡単です。

1回目に生成させた画像の中で良さげな絵になったものを読み込ませます。

ちなみに、ソフト画面に表示されている画像を右クリックして「Use as Initialization Image」を選べば img2img の入力にすぐセットできるので便利です。

NMKD Stable Diffusion GUIで表示されている画像を右クリックした際に表示されるメニュー

 

設定パラメータを調整後に再び画像を生成させた結果、ちゃんと写真に近づいた画像が出力されました。

落書きにStable Diffusionのimg2imgを2回行い、写真風画像を生成

必要に応じてプロンプトや設定を修正したり、更にもう一度 img2img したりしていい感じの写真を作ってみてください。

プロンプトの工夫

今回は

a beautiful realistic photo of landscape, green mountains in the background, a river in the center, blue sky and some clouds, canon eos 5d mark iv

というプロンプトで風景画像を生成しました。

単に「photo of ○○」と入れるだけでなく、カメラ名や解像度をプロンプト文字列に加えると生成される画像の写真的クオリティがUPすることがあります。

例: canon eos 5d mark iv

レンズの焦点距離をプロンプトに指定してピンボケ具合を調整するなんてテクニックもあるみたいです。

 


Stable Diffusion さん、使い方次第で夢が広がりそうですね。

MSペイントで描いた適当な山と川の落書き(左)と、それをStable Diffusionのimg2imgに複数回通し、写真風に変換したもの(右)

(↑左の落書きに3回 img2img を適用)

 

※肝心な Stable Diffusion の理論部分を何一つ理解していない状態で使用しているので、上記の説明には不正確&曖昧な部分が多々含まれていると思います。(特に設定パラメータに関して)

正確な説明ができずすみません…!

 

画像を指示した通りに自由に編集したい!

InstructPix2Pix

どのように画像を変えたいかテキストで指示するだけで、画像を自由自在に編集できる InstructPix2Pix という機能があります。

InstructPix2Pix を使用し、画像に指示テキストを与えてAIに編集させた例。(使用ソフトはNMKD Stable Diffusion GUI)

写真の中に無い物を付け足す・不要な物を除去する・写っている物を別の物に置き換える・画風を変える・被写体はそのままに時間 (朝・昼・夕・夜) や場所 (東京・パリ・宇宙…) だけ変更するといったことができます。

詳しい手順は以下のページをご参照ください。

テキスト指示で画像を自由に描き変え

画像生成AIの「Stable Diffusion」をパソコンから簡単に使えるソフト「NMKD Stable Diffusion GUI」 のバージョン1.9台の新機能・変更点です。 含まれるバージョン 1.9.0 / 1.9.1 なお[…]

 

画像の一部分だけを Stable Diffusion で変更したい!

Masked Inpainting

画像の一部領域だけを指定してそこだけ描き変えられる Masked Inpainting という機能があります。

詳しい手順は以下のページをご参照ください。

マスク機能で一部だけ描き変え

画像生成AIの「Stable Diffusion」をコマンド操作不要で簡単に使えるソフト「NMKD Stable Diffusion GUI」が 2022/09/20 に大型アップデートしました! 現在の最新版がバージョン 1.4.0[…]

Inpainting 専用モデル

Masked Inpainting の精度を大幅に向上させるためにインペイント専用モデルが利用できます。

例えば画像中で男の子が写っている部分だけを塗って Masked Inpainting すると、男の子を自然に消したり猫に変えたりできます。

詳しい手順は以下。

Inpainting専用モデルの利用

画像生成AIの「Stable Diffusion」をコマンド操作不要で簡単に使えるソフト「NMKD Stable Diffusion GUI」 のバージョン1.8台の新機能・変更点です。 含まれるバージョン 1.8.0 / 1.8.1 […]

 

img2img でキャラの絵柄や表情を変更

img2img はもちろん風景写真に限らず、落書きのイラスト化にも使えます。

それ以外の用途として、既にある程度形ができているキャラ絵の表情や絵柄を変えたい時や、AI生成で足の本数が余計に多い動物キャラができてしまった場合の手直しにも使えます。


左の絵を img2img (2回) で右の絵に。変だった足の本数が修正でき、キャラの表情や毛並みも変更できました。

※動物キャラの表情修正には、動物キャラ用のモデルファイルを利用しました。

 

img2img を活用して動物マスコットキャラを作る手順について以下のページに記載したので興味があればぜひ!

動物キャラを生成

画像生成AIの「Stable Diffusion」で人間キャラクターを作成した例はたくさん見かけますが、動物キャラクターは情報が非常に少ないのでこちらに方法をまとめました。 かわいい動物キャラクター・マスコット・ケモノキャラを生成させ[…]

Stable Diffusion で furry_epoch4.ckpt モデルを使って生成したかわいい動物キャラ(ケモノ)の画像たち
記事化前の最新情報はこちらで先にツイートしています。サイト更新告知もこちら。