キャラチャット用ローカルLLM環境 SillyTavern+KoboldCpp のインストール方法 (画像付き)

手元のPCで文章生成AIを動かして自分で作ったキャラたちとおしゃべりしたい! って方向けに環境構築の手順をメモしました。

オンラインの各種文章生成AIサービスに接続することなく、完全にローカルで実行できるようにローカルLLM環境を用意します。

(これで ChatGPT に「あなたは私のイケメンな猫彼氏です」とか恥ずかしいこと言わずに済むようになります)

 

導入したのは次の2つのソフト (と、動作に必要な言語モデル) です。

SillyTavern

AIとチャットするための会話画面(フロントエンド)。

キャラ設定や会話ログの管理機能など、おしゃべり用に色々便利な機能が用意されている。

これ自体はAI本体ではないので、外部のAI (ローカル/クラウドどちらもOK) と接続して使用する。

KoboldCPP

自分のPCでAIモデルを動かすためのソフト。

ダウンロードした言語モデルをこれに読み込ませる。

 

推奨動作環境は次の通りです。

OS:Windows 10 / 11 (※1)
メモリ(RAM):16 GB以上推奨 (できれば 32 GB以上)
GPU:VRAM 8 GB以上推奨 (できれば 12 GB以上) (※2, 3)
ストレージ:SSD。空き数十GB~

※1:Windows 以外でも実行は可能ですが、このページの手順と大まかな流れ以外は変わってくると思います。
※2:Nvidia 製のグラフィックボード搭載の前提で進めます。
※3:グラボ無しでも CPU だけで動作させることはできるみたいです。(どのくらい遅くなるかは未確認)

 

参考:私の動作環境 (クリックして表示)
  • OS:Windows 11
  • メモリ(RAM):96 GB
  • グラボ:NVIDIA GeForce RTX 4070 Ti SUPER
  • ストレージ:SSD

小さいLLM (パラメータサイズ ~14B) 程度であれば実用的な速度で動かせましたが、これだと大きなサイズのモデルの高速な実行は厳しそうです…。

 

SillyTavern 導入前事前準備

Git のインストール

SillyTavern を入れるために Git 環境が必要になるので、もし未導入の場合はこちらの手順でインストールしてください。

Gitの導入

PC引っ越しのたびに迷わないように、Git の導入手順をメモ。 Windows 環境にて、直でそのままインストール。 (個人用雑メモ) Git のインストール まず以下のページの手順通りに Git をインストールする。 ([…]

 

Node.js のインストール

SillyTavern を動かすために Node.js が必要になるので、未導入の場合は以下の手順でインストールしてください。

 

Node.js のインストール方法 (クリックして表示)

ダウンロードとインストール

まずは公式サイトに移動。

リンク:Node.js のインストール (公式)

 

「Node.js を入手」をクリック。

 

赤線部のバージョン表記が (LTS) と付いている物になっているか確認してから、「Windows インストーラー (.msi)」ボタンをクリック。

ダウンロードが始まる。

 

ダウンロードしたインストーラーを実行する。
(ここでは node-v24.12.0-x64.msi。バージョンによってファイル名は異なる。)

 

Next を押す。

 

ライセンス文書を読んだら同意のチェックを入れて、Next。

 

Next。

 

Next。

 

Next。

 

Install ボタンを押すとインストールが始まる。

 

インストールが完了したらこの画面になるので「Finish」をクリック。

 

動作確認

Windows PowerShell を開く。

(スタートメニューから検索するか、スタートボタン右クリック → Windows PowerShell から開ける)

 

以下のコマンドを入力してEnter。

node --version

 

インストールしたバージョンが「v24.12.0」などというように表示されればインストールに成功している。

 

 

SillyTavern のインストール方法

インストール場所の用意

Program Files などの Windows のシステムフォルダには入れないように注意。

ドライブ直下に「SillyTavern」という名前のフォルダを作ってその中にインストールするのが無難で分かりやすいかも。

私は Cドライブ の肥大化を避けるため、他の画像生成AIなどもまとめて置いてある別のSSDドライブにインストールしました。
(以下のディレクトリ)

G:\AI\SillyTavern

Stable Diffusion (画像生成AI) とか色々な各種AIは「AI」フォルダにまとめて、その中に個別に各環境用のフォルダを作成しています。

 

以下の手順では私のディレクトリでインストールした場合の画面になっていますが、適宜ご自身のインストール先に読み替えてご覧ください。

 

インストール

先ほど用意した、インストールしたいフォルダ内まで移動する。

 

アドレスバーに「cmd」と打ってEnter。

 

この場所でコマンドプロンプトが立ち上がるので、以下のコマンドを入力してEnter。
(安定版の SillyTavern を Git でインストールするコマンド。)

git clone https://github.com/SillyTavern/SillyTavern -b release

 

すると、ファイルのダウンロードが始まる。

しばらく待機。(私の環境では3分ちょっとくらいかかりました)

 

ダウンロードが完了すると次のような画面になる。

 

先ほど用意した「SillyTavern」フォルダの中に必要なファイルたちが配置された。

 

下の方までスクロールすると「Start.bat」があるので、それをダブルクリックして実行する。

 

PowerShell の黒い画面が立ち上がる。

数秒待機する。

 

ブラウザで SillyTavern の画面が立ち上がったら起動完了。

SillyTavern のインストール方法:初回起動画面

 

実行後、画面が進まない場合 (クリックして表示)

実行した後に「npm install」という黒い画面が表示され、1分近く何も表示されない現象が発生。

 

時間が経つとエラーログが表示され、ネットワーク接続がうまくいかなかったという警告が…。

SillyTavern起動時のエラー: Error [ERR_MODULE_NOT_FOUND]: Cannot find package 'yargs' imported from

Error [ERR_MODULE_NOT_FOUND]: Cannot find package 'yargs' imported from …(続)

 

私の場合、一旦この画面を閉じてもう一度「Start.bat」を実行したら正常に起動が進みました

 

ここでは一旦、言語として「日本語 (Japanese)」を選択して、ペルソナ名に自分のユーザー名を入力して「保存」をクリック。

(名前は後から簡単に追加・変更できるので適当でOK。日本語も可。)

SillyTavern のインストール方法:初回起動画面での設定項目

 

これで一旦 SillyTavern のインストールは完了。

 

KoboldCpp のインストール方法

KoboldCpp は .exe ファイルをダウンロードして実行するだけなので導入は楽です。

 

KoboldCpp のダウンロード

まずはダウンロード先に移動。

リンク:Releases · LostRuins/koboldcpp

リンク先に移動したら、下の方までスクロールして「Assets」欄に移動。

koboldcpp.exe をクリックしてダウンロード。

 

ダウンロードが完了したら、適宜 koboldcpp.exe を好きな場所に移動。

(ダウンロードフォルダでもそのまま実行できますが、私は AI 関連のソフトや環境はまとめて「AI」フォルダに入れているので次のディレクトリに配置しました。)

G:\AI\KoboldCpp

 

koboldcpp.exe を起動する。

 

もし実行時に「Windows によってPCが保護されました」と表示されたら「詳細情報」をクリック。

 

「実行」をクリック。

 

数秒待つとソフト画面が立ち上がる。

KoboldCppのインストール方法:ソフト起動画面

 

言語モデルのダウンロード

言語モデルは無数にありますが、日本語でキャラとおしゃべりしたいので日本語での動作が確認されているモデルをとりあえず一つ選びます。

それでも数が多すぎるのですが、ありがたいことに以下のサイトでおすすめの言語モデルがまとめられていました。
(各モデルに説明が付いている)

 

今回は新しめのモデルで、複数のパラメータサイズの物が公開されている Qwen3 という LLM を試しに使ってみます。
(おしゃべり目的なら本当はロールプレイ用モデルの方がいいのかも…)

上記のサイトでグラボの VRAM サイズに合わせておすすめの言語モデルが表になっているので、自分のグラボに合わせた物を選択します。

(私は VRAM:16 GB なので Qwen3-14B を選びました。以下その流れで進めます。)

 

モデルのダウンロード先はこちらです。

リンク:Qwen3-14B-GGUF

モデルをダウンロードするときは上記のように「GGUF」版をダウンロードしてください

KoboldCpp で読み込むにはモデルの形式が GGUF 形式である必要があります。(拡張子 .gguf)
(モデル名+gguf でググると出てきます)

 

リンク先のモデル配布ページに着いたら「Files」をクリック。

 

gguf ファイルが複数置かれていますが、今回はその中でも「Qwen3-14B-Q4_K_M.gguf」をダウンロードしてみます。

下矢印のダウンロードボタンを押してください。

9 GBと巨大なのでダウンロードが完了するまでしばらく待ちます。

ダウンロードしたモデルファイルは管理しやすいように KoboldCpp と同じフォルダに入れておくか、用意した「AI」フォルダ内に「LLMmodels」みたいなフォルダを作ってその中にいれてまとめて管理するのが楽かもです。

 

KoboldCpp でモデルを読み込み

ソフト画面の「Browse」ボタンからファイル選択画面を開き、先ほどダウンロードしたモデルファイルを読み込む。

KoboldCppでモデルを読み込む方法

 

Launch ボタンを押して開始。

KoboldCppで読み込んだモデルを起動する方法

 

ソフト画面が閉じ、起動処理がバックグラウンドで進む。

数十秒待って「パブリックネットワークとプライベートネットワークにこのアプリへのアクセスを許可しますか?」というポップアップが表示されたら「許可」を押す。

 

コマンドプロンプトで

Please connect to custom endpoint at http://localhost:5001

と表示されたら起動完了。

※この時 KoboldCpp のブラウザ画面も開くけど、画面操作は SillyTavern 側で行うので無視してOK。

この黒画面 (プロンプト画面) はソフト動作中に閉じないように (こっちが本体なので)。
(逆にソフトを終了・再起動させたい場合はこれを閉じる。)

 

KoboldCpp と SillyTavern の接続

SillyTavern のブラウザタブに戻り、画面上部のメニューバーからコンセントプラグ型のボタンを押す。

KoboldCpp と SillyTavern の接続方法:API接続ボタンを押す

 

API の選択リストを「AI Horde」から「テキスト補完」に変える。

KoboldCpp と SillyTavern の接続方法:APIの選択リストを「テキスト補完」にする

 

APIタイプの選択リストから「KoboldCpp」を選ぶ。

KoboldCpp と SillyTavern の接続方法:APIタイプをKoboldCppに変える

 

API URL のところに、先ほどコマンドプロンプトで表示されたアドレス

http://localhost:5001

を入力してリストからそれをクリックすると、接続が完了する。

KoboldCpp と SillyTavern の接続方法:API URL を変更する

 

下の「接続」欄に今読み込んだモデル名が出て状態表示の丸が緑色になっていればOK。

次回から自動接続できるように「前回のサーバーに自動接続」にチェックを付けておく。

 

動作確認 おしゃべりしてみよう!

これでローカルLLMとおしゃべりする準備が整いました。

画面右上の Temporary Chat (一時チャット) をクリックすると、ログが保存されない一時チャット画面に移ります。

SillyTavern の使い方:Temporary Chat

※画面がどこだか分からなくなってしまったら、一度ブラウザの更新ボタンを押せばこの画面に戻ってこられます。

 

チャット画面に移ったら、一番下に入力欄があるので何か入力してみます。

Enterキー、または②の紙飛行機ボタンで送信できます。
※入力欄で改行したいときは 「Shift+Enter」

SillyTavern の使い方:Temporary Chatのチャット画面の使い方

 

返事が返ってくれば成功です!

SillyTavern の使い方:Temporary Chatのチャット画面でおしゃべりした結果

 

現時点ではただの一時チャットで、キャラ設定や自分自身の情報の設定、おしゃべりを制御するプロンプトの入力などを何も行っていないためキャラ会話はまだできない状態です。

とりあえず動くことだけ確認できればOK。

基本的な使い方や肝心のキャラ会話用の設定は別ページにてこの後説明予定です。

 

これ以降の起動方法について

次回以降 SillyTavern を使う際は次の手順で起動すればOKです。

  1. koboldcpp.exe を立ち上げて、言語モデルを読み込む (Launch)
  2. SillyTavern のフォルダにある Start.bat を実行して SillyTavern を立ち上げる
  3. SillyTavern の上部メニューのコンセントプラグボタンを押して、KoboldCpp と接続されているか確認する
    (自動接続にチェックを付けていれば不要)

 

終了するときは、バックグラウンドで立ち上がっている2つのコマンドプロンプト画面を閉じればOKです。

 

参考情報

SillyTavern の公式ドキュメントはこちら。

リンク:SillyTavern Documentation

SillyTavern+KoboldCpp キャラチャット用 ローカルLLM環境の構築方法
記事化前の最新情報はこちらで先にツイートしています。サイト更新告知もこちら。