Stable Diffusion 1.5 モデルを NMKD Stable Diffusion GUI で使う

画像生成AIの Stable Diffusion の最新バージョン 1.5 のモデルファイルが2022年10月20日に公開されました。

今回公開された最新の Stable Diffusion 1.5 をソフト NMKD Stable Diffusion GUI で使用する方法について記載します。

(上記ソフトは Windows 上で Stable Diffusion をコマンド操作なしに簡単に使えるソフトです。使い方は以下参照)

ソフトの使い方

入力したテキストから画像を生成したり、自分が描いた落書きに説明テキストを加えれば思い通りの絵に変えたりできるAI「Stable Diffusion」 ↑a sleeping cat in the hot spring (温泉で眠る[…]

※ソフトダウンロード時に同梱されているモデルファイルは最新版ではなく v1.4 なので、v1.5 を使いたい場合は今回のように手動で導入する必要があります。(2022/10/29時点)

 

大まかな手順は次のとおりです。

  1. Stable Diffusion 配布先サイト (Hugging Face) への登録
  2. モデルファイル (v1-5-pruned-emaonly.ckpt) のダウンロード
  3. モデルをファイルをソフトに読み込ませる

① Hugging Face への登録

Stable Diffusion 1.5 のモデルファイルをダウンロードするためには配布先サイト (Hugging Face) への登録が必要になります。

※既にログイン済みの場合は以下のリンクから直接ダウンロードできますが、未登録の場合は認証画面が現れダウンロードできません。

リンク(要登録):v1-5-pruned.ckpt

 

登録方法

以下のリンクから Stable Diffusion 1.5 の配布先ページに移動します。

We’re on a journey to advance and democratize artificial int…

 

「Sign Up」を押してアカウント登録画面に進みます。

 

登録したいメールアドレスとパスワードを入力して「Next」をクリックします。

※パスワードは大文字・小文字・数字を含める必要があります。

 

Username欄にユーザー名、Full name欄にフルネームを入力し、Terms of Service(利用規約) と Code of Conduct(行動規範) の内容を確認したらチェックを入れ「Create Account」をクリックします。

 

先ほど入力したメールアドレス宛てに確認メールが届くので、本文中のURLをクリックして登録を完了させます。

 

② モデルファイルのダウンロード

登録したら、Stable Diffusion 1.5 の配布ページに戻ります。

表示されているライセンス文を読んだら「I have read the License and agree with its terms」にチェックを入れて「Agree and access repository」をクリックします。

 

「Files and versions」をクリックしてファイル一覧画面に移動します。

 

v1-5-pruned-emaonly.ckpt」をクリックします。

 

ダウンロード画面で「download」を押すとダウンロードが始まります。

4.27 GB もあるので気長にお待ち下さい。

 

③ モデルをファイルをソフトで読み込む

今ダウンロードした Stable Diffusion 1.5 のモデルファイル(.ckpt) を NMKD Stable Diffusion GUI に読み込ませます。

※以下、ソフト画面は NMKD Stable Diffusion GUI バージョン1.6.0 のものです。

 

ソフト画面右上の歯車ボタンを押して  Settings(設定) 画面を開いてください。

Stable Diffusion Model File のところにある「Folders...」ボタンをクリックします。

※旧バージョンのソフトの場合ここが「Open Folder」ボタンになっており、押して表示されるフォルダに先ほどダウンロードした「v1-5-pruned-emaonly.ckpt」を入れればOKです。

 

  1. フォルダリストをクリックします
  2. 右上のフォルダボタンを押します

するとモデルファイル保存先フォルダが表示されるので、ここに先ほどダウンロードした「v1-5-pruned-emaonly.ckpt」を入れてください。

入れたらこの Model Folders 画面を閉じて先ほどの Settings 画面に戻ります。

 

Stable Diffusion Model File のモデル選択リストで「v1-5-pruned-emaonly.ckpt」を選択します。

※今入れたモデルファイルがリストに表示されていない場合は、Reflesh List ボタンを押してリストを更新してください。

 

Settings画面を閉じれば完了です。

これで次回以降の画像生成はこの新しい Stable Diffusion 1.5 モデルファイルを使って行われます。

 

Stable Diffusion 1.4 と 1.5 の比較

結論を言うと、自分が試した例では必ずしも 1.5 の方が良い出力になるとは限りませんでした。

掲載した画像以外にもいくつかのプロンプトで複数枚生成させてみましたが、1.5 で劇的に画像の質が向上するわけではありませんでした。

無理に 1.5 を使うより、使用例やプロンプトノウハウの蓄積した 1.4 を使ったほうが良いかもしれません。

(もしかしたら特定プロンプトでは 1.5 がその真価を発揮するのかも)

 

以下、Stable Diffusion 1.4と 1.5 のそれぞれにおいて特定プロンプトで Seed値 521106007~521106009 の3枚を生成させた結果を比較します。

設定値は以下の通り共通です。

Steps:50
Scale:7.50
Generated Resolution:512x512
Sampler:k_euler_a

前が 1.4、後ろが 1.5 で生成した画像です。

 

ネコ

beautiful photo of sitting orange tabby cat

茶トラにゃんこが座っている写真を生成しました。

上記1番目を含めて何枚かの画像では目が若干改善しましたが、Stable Diffusion 1.5 でも瞳がおかしい猫画像が生成する機会は結構ありました。

2番目の画像では 1.5 でしっぽの位置が若干改善していますが瞳はおかしいままです。

子どもの笑顔

smiling child face

 

子どもの顔写真は比較的向上したものが多かったです。

1.4 ではおかしかった顔が、顔復元 (Face Restoration) を使用していなくても大きく修正されました。

ちなみに2番目の画像のように、Stable Diffusion 1.5 に変えると同一プロンプト・シード・設定であっても大きく構図が変わる場合があります。

山と川の風景写真

a beautiful realistic photo of landscape, green mountains in the background, a river in the center, blue sky and some clouds, canon eos 5d mark iv

「美しいリアルな風景写真、背景は緑の山々、中央には川、青い空と雲」という指定です。
(写真の質向上のため、カメラの機種名もプロンプトに含めています。)

質の改善は見られませんでした。

これ以外の画像についても複数枚確認しましたが、個人的にはどちらかといえば 1.4 で生成した画像のほうが好みです。

 

以上のように、プロンプトによって Stable Diffusion 1.5 を使うメリットの大小が変わってくるので難しいです。

ただモデルの変更で全体的に画像にそこそこ変化があったので、Webで良さげな画像生成例を見かけたらそれが 1.4 と 1.5 のどちらのモデルで生成しているかはちゃんと確認をとったほうが良さそうです。

パソコン相談も受付中(*・ᴗ・*) よろしければフォローお願いします(懇願)