画像生成AI「Stable Diffusion」で使用できる画像生成モデル「SDXL1.0」の導入方法です。
(Stable Diffusion XL v1.0)
前世代の Stable Diffusion 1.5 (SD 1.5) などと比較して、より大きなサイズの画像をより精度良く生成できるモデルです。
生成サイズ:1024×1024
文字入り画像生成成功率:2 / 10
生成サイズ:512×512
文字入り画像生成成功率:0 / 10
photo of a sitting cat with a board that reads "Cute"
(Cute と書かれたボードと座っている猫の写真)
画像の推奨生成サイズが 1024×1024 に上がり、アップスケール無しで最初から大きなサイズで画像を生成できるようになりました。
(旧来の SD 1.5 でいきなり 1024×1024 サイズで生成させると、頻繁に画像が破綻した)
以前はほぼ不可能だった、指定した文字入りの画像を生成させることも可能です。
(成功率自体は低いですが)
導入環境
何種類もある Stable Diffusion 環境を 1 つのソフトでインストール・管理できる統合環境「Stability Matrix」での手順を記載します。
Stability Matrix の場合、SDXL1.0 の導入がほぼクリック操作だけで済みます。
※ もし Stability Matrix 未導入の場合は以下を参照。
入力したテキストから画像を生成したり、自分が描いた落書きに説明テキストを加えれば思い通りの絵に変えたりできるAI「Stable Diffusion」 ↑a sleeping cat in the hot spring (温泉で眠る[…]
説明に使用した UI 環境は Stable Diffusion WebUI reForge 版ですが、AUTOMATIC1111 版でも同様の手順で実行できるはずです。
SDXL 1.0 のダウンロードと導入
SDXL 1.0 モデルのダウンロード
Stability Matrix のソフト画面で、左端にある赤枠で囲ったボタンをクリックします。
Model Browser (モデルの検索/ダウンロード画面) が開きます。
「Hugging Face」をクリックします。
画像赤枠の Stable Diffusion XL (Base) モデルにチェックを入れて、「インポート」を押します。
(使う機会は個人的に無いですが、Refiner モデルを試してみたい方は青枠で囲った Stable Diffusion XL (Refiner) も一緒にチェック入れてOKです)
画面右下の「インポート」を押すとダウンロードが始まるのでしばらく待ちます。
ダウンロードが完了すると通知が届き、Stable Diffusion XL (Base) のところが薄字になります。
これでモデルのダウンロードと導入が完了し、Stable Diffusion の WebUI 画面から使えるようになっています。
SDXL 1.0 用 VAE のダウンロード (任意)
どうやらモデルにデフォルトの VAE が内蔵されているみたいなので、別途ダウンロードする必要は無さそうです。
以下の手順は飛ばしても構いません。
SDXL 1.0 の公式 VAE を Stability Matrix からダウンロードしたい場合、CivitAI を経由してダウンロードします。
Stability Matrix と CivitAI の接続設定が済んでいない場合はこちらのサイトの手順を参考に事前に設定を済ませてください。
モデルブラウザ画面で、CivitAI を押します。
検索ボックスに「sdxl_vae」と入力し、モデルタイプを「VAE」にして検索します。
すると「SDXL VAE」が候補に出てくるので、これをクリックします。
「インポート」を押せばダウンロードが始まります。
ダウンロードが完了したら Windows に通知が届きます。
SDXL 1.0 モデルの使用方法
※以下、Stable Diffusion WebUI reForge 版の画面で説明しますが、AUTOMATIC1111版も同様だと思います。
まずはモデル(checkpoint)を SDXL 1.0 の物に切り替えます。
表示名は「sd\sd_xl_base_1.0_0.9vae.safetensors」になっています。
※モデルの選択肢に表示されなかった場合、選択欄の右にある更新ボタンを押してモデル一覧を更新してください。
モデルの切り替えには十数秒~数十秒かかるのでしばらく待ちます。
切り替えが終わったら、忘れずに画像の幅と高さを 1024 (付近) に設定して準備完了です。
あとはいつも通りプロンプトを入力して「生成」を押せば SDXL 1.0 で画像生成できます。
(Stable Diffusion 1.5 と比べると VRAM 消費量が大きく、生成に時間もかかります)