LMスタジオを使用したカスタムLLM構築

LMスタジオのインストール

LMスタジオを起動させ、画面中央にある検索バーからLLMを検索します。
ここでは例として「DataPilot-ArrowPro-7B-KUJIRA-gguf」を使用してLLMを構築していきます。
検索をすると画面右側に該当する検索候補が複数表示されます。
目的のLLMを見つけたら「Download」をクリックしてモデルのダウンロードを開始します。

ダウンロード完了後、左サイドバー内にある「↔」ボタンをクリックして画面のモードを変更します。
画面上部にある「Select a model to load」をクリックすると、プルダウンでダウンロード済みのLLMが一覧で表示されるので、ダウンロードしたモデルを選択します。
- 画面中央付近にailia DX Insight内の設定で使用するカスタムLLMのURLが表示されます。（通常はlocalhost:1234に設定されます）
- 画面右側「Model Inspector」内に記載のcontext_lengthの数値がailia DX Insight内の設定で使用する「最大トークン数」となります。

詳しい設定画面の呼び出し方はこちらをご参照ください。

(*)未記入の場合、HTTPの接続エラーになります。

画面右側の「Advanced Configration」内にある「GPU Settings」のパラメータ値を変更することでGPUメモリを使用する割合を変更することができます。
GPU Offloadパラメータを最大に設定すると、GPUメモリを使用した高速処理をおこなうことができます。