手元のPCで文章生成AIを動かして自分で作ったキャラたちとおしゃべりしたい! って方向けに環境構築の手順をメモしました。
オンラインの各種文章生成AIサービスに接続することなく、完全にローカルで実行できるようにローカルLLM環境を用意します。
(これで ChatGPT に「あなたは私のイケメンな猫彼氏です」とか恥ずかしいこと言わずに済むようになります)
導入したのは次の2つのソフト (と、動作に必要な言語モデル) です。
SillyTavern
AIとチャットするための会話画面(フロントエンド)。
キャラ設定や会話ログの管理機能など、おしゃべり用に色々便利な機能が用意されている。
これ自体はAI本体ではないので、外部のAI (ローカル/クラウドどちらもOK) と接続して使用する。
KoboldCPP
自分のPCでAIモデルを動かすためのソフト。
ダウンロードした言語モデルをこれに読み込ませる。
推奨動作環境は次の通りです。
メモリ(RAM):16 GB以上推奨 (できれば 32 GB以上)
GPU:VRAM 8 GB以上推奨 (できれば 12 GB以上) (※2, 3)
ストレージ:SSD。空き数十GB~
※1:Windows 以外でも実行は可能ですが、このページの手順と大まかな流れ以外は変わってくると思います。
※2:Nvidia 製のグラフィックボード搭載の前提で進めます。
※3:グラボ無しでも CPU だけで動作させることはできるみたいです。(どのくらい遅くなるかは未確認)
SillyTavern 導入前事前準備
Git のインストール
SillyTavern を入れるために Git 環境が必要になるので、もし未導入の場合はこちらの手順でインストールしてください。
PC引っ越しのたびに迷わないように、Git の導入手順をメモ。 Windows 環境にて、直でそのままインストール。 (個人用雑メモ) Git のインストール まず以下のページの手順通りに Git をインストールする。 ([…]
Node.js のインストール
SillyTavern を動かすために Node.js が必要になるので、未導入の場合は以下の手順でインストールしてください。
SillyTavern のインストール方法
インストール場所の用意
Program Files などの Windows のシステムフォルダには入れないように注意。
ドライブ直下に「SillyTavern」という名前のフォルダを作ってその中にインストールするのが無難で分かりやすいかも。
私は Cドライブ の肥大化を避けるため、他の画像生成AIなどもまとめて置いてある別のSSDドライブにインストールしました。
(以下のディレクトリ)
↑Stable Diffusion (画像生成AI) とか色々な各種AIは「AI」フォルダにまとめて、その中に個別に各環境用のフォルダを作成しています。
以下の手順では私のディレクトリでインストールした場合の画面になっていますが、適宜ご自身のインストール先に読み替えてご覧ください。
インストール
先ほど用意した、インストールしたいフォルダ内まで移動する。

アドレスバーに「cmd」と打ってEnter。

この場所でコマンドプロンプトが立ち上がるので、以下のコマンドを入力してEnter。
(安定版の SillyTavern を Git でインストールするコマンド。)

すると、ファイルのダウンロードが始まる。
しばらく待機。(私の環境では3分ちょっとくらいかかりました)

ダウンロードが完了すると次のような画面になる。

先ほど用意した「SillyTavern」フォルダの中に必要なファイルたちが配置された。

下の方までスクロールすると「Start.bat」があるので、それをダブルクリックして実行する。

PowerShell の黒い画面が立ち上がる。
数秒待機する。

ブラウザで SillyTavern の画面が立ち上がったら起動完了。

ここでは一旦、言語として「日本語 (Japanese)」を選択して、ペルソナ名に自分のユーザー名を入力して「保存」をクリック。
(名前は後から簡単に追加・変更できるので適当でOK。日本語も可。)

これで一旦 SillyTavern のインストールは完了。
KoboldCpp のインストール方法
KoboldCpp は .exe ファイルをダウンロードして実行するだけなので導入は楽です。
KoboldCpp のダウンロード
まずはダウンロード先に移動。
リンク:Releases · LostRuins/koboldcpp


ダウンロードが完了したら、適宜 koboldcpp.exe を好きな場所に移動。
(ダウンロードフォルダでもそのまま実行できますが、私は AI 関連のソフトや環境はまとめて「AI」フォルダに入れているので次のディレクトリに配置しました。)
koboldcpp.exe を起動する。

もし実行時に「Windows によってPCが保護されました」と表示されたら「詳細情報」をクリック。

「実行」をクリック。

数秒待つとソフト画面が立ち上がる。

言語モデルのダウンロード
言語モデルは無数にありますが、日本語でキャラとおしゃべりしたいので日本語での動作が確認されているモデルをとりあえず一つ選びます。
それでも数が多すぎるのですが、ありがたいことに以下のサイトでおすすめの言語モデルがまとめられていました。
(各モデルに説明が付いている)
今回は新しめのモデルで、複数のパラメータサイズの物が公開されている Qwen3 という LLM を試しに使ってみます。
(おしゃべり目的なら本当はロールプレイ用モデルの方がいいのかも…)
上記のサイトでグラボの VRAM サイズに合わせておすすめの言語モデルが表になっているので、自分のグラボに合わせた物を選択します。
(私は VRAM:16 GB なので Qwen3-14B を選びました。以下その流れで進めます。)
モデルのダウンロード先はこちらです。
リンク:Qwen3-14B-GGUF
モデルをダウンロードするときは上記のように「GGUF」版をダウンロードしてください。
KoboldCpp で読み込むにはモデルの形式が GGUF 形式である必要があります。(拡張子 .gguf)
(モデル名+gguf でググると出てきます)
リンク先のモデル配布ページに着いたら「Files」をクリック。

gguf ファイルが複数置かれていますが、今回はその中でも「Qwen3-14B-Q4_K_M.gguf」をダウンロードしてみます。
下矢印のダウンロードボタンを押してください。

9 GBと巨大なのでダウンロードが完了するまでしばらく待ちます。
ダウンロードしたモデルファイルは管理しやすいように KoboldCpp と同じフォルダに入れておくか、用意した「AI」フォルダ内に「LLMmodels」みたいなフォルダを作ってその中にいれてまとめて管理するのが楽かもです。
KoboldCpp でモデルを読み込み
ソフト画面の「Browse」ボタンからファイル選択画面を開き、先ほどダウンロードしたモデルファイルを読み込む。

Launch ボタンを押して開始。

ソフト画面が閉じ、起動処理がバックグラウンドで進む。
数十秒待って「パブリックネットワークとプライベートネットワークにこのアプリへのアクセスを許可しますか?」というポップアップが表示されたら「許可」を押す。

コマンドプロンプトで
と表示されたら起動完了。

※この時 KoboldCpp のブラウザ画面も開くけど、画面操作は SillyTavern 側で行うので無視してOK。
この黒画面 (プロンプト画面) はソフト動作中に閉じないように (こっちが本体なので)。
(逆にソフトを終了・再起動させたい場合はこれを閉じる。)
KoboldCpp と SillyTavern の接続
SillyTavern のブラウザタブに戻り、画面上部のメニューバーからコンセントプラグ型のボタンを押す。

API の選択リストを「AI Horde」から「テキスト補完」に変える。

APIタイプの選択リストから「KoboldCpp」を選ぶ。

API URL のところに、先ほどコマンドプロンプトで表示されたアドレス
を入力してリストからそれをクリックすると、接続が完了する。

下の「接続」欄に今読み込んだモデル名が出て状態表示の丸が緑色になっていればOK。
次回から自動接続できるように「前回のサーバーに自動接続」にチェックを付けておく。
動作確認 おしゃべりしてみよう!
これでローカルLLMとおしゃべりする準備が整いました。
画面右上の Temporary Chat (一時チャット) をクリックすると、ログが保存されない一時チャット画面に移ります。

※画面がどこだか分からなくなってしまったら、一度ブラウザの更新ボタンを押せばこの画面に戻ってこられます。
チャット画面に移ったら、一番下に入力欄があるので何か入力してみます。
Enterキー、または②の紙飛行機ボタンで送信できます。
※入力欄で改行したいときは 「Shift+Enter」

返事が返ってくれば成功です!

現時点ではただの一時チャットで、キャラ設定や自分自身の情報の設定、おしゃべりを制御するプロンプトの入力などを何も行っていないためキャラ会話はまだできない状態です。
とりあえず動くことだけ確認できればOK。
基本的な使い方や肝心のキャラ会話用の設定は別ページにてこの後説明予定です。
これ以降の起動方法について
次回以降 SillyTavern を使う際は次の手順で起動すればOKです。
- koboldcpp.exe を立ち上げて、言語モデルを読み込む (Launch)
- SillyTavern のフォルダにある Start.bat を実行して SillyTavern を立ち上げる
- SillyTavern の上部メニューのコンセントプラグボタンを押して、KoboldCpp と接続されているか確認する
(自動接続にチェックを付けていれば不要)
終了するときは、バックグラウンドで立ち上がっている2つのコマンドプロンプト画面を閉じればOKです。
参考情報
SillyTavern の公式ドキュメントはこちら。












![SillyTavern起動時のエラー: Error [ERR_MODULE_NOT_FOUND]: Cannot find package 'yargs' imported from](https://pajoca.com/wp-content/uploads/2026/01/img_696317499b739.png)