LMスタジオを使用したカスタムLLM構築

LMスタジオのインストール

  1. https://lmstudio.ai/よりLMスタジオをインストールします。
    CustomLLM_03

カスタムLLMのダウンロード

  1. LMスタジオを起動させ、画面中央にある検索バーからLLMを検索します。
    ここでは例として「DataPilot-ArrowPro-7B-KUJIRA-gguf」を使用してLLMを構築していきます。
    CustomLLM_04
  2. 検索をすると画面右側に該当する検索候補が複数表示されます。
    目的のLLMを見つけたら「Download」をクリックしてモデルのダウンロードを開始します。
    CustomLLM_05

カスタムLLMの立ち上げ

  1. ダウンロード完了後、左サイドバー内にある「↔」ボタンをクリックして画面のモードを変更します。
    画面上部にある「Select a model to load」をクリックすると、プルダウンでダウンロード済みのLLMが一覧で表示されるので、ダウンロードしたモデルを選択します。
    CustomLLM_06
    • 画面中央付近にailia DX Insight内の設定で使用するカスタムLLMのURLが表示されます。(通常はlocalhost:1234に設定されます)
      CustomLLM_07
    • 画面右側「Model Inspector」内に記載のcontext_lengthの数値がailia DX Insight内の設定で使用する「最大トークン数」となります。
      CustomLLM_08

aillia DX InsightでカスタムLLMの登録

詳しい設定画面の呼び出し方はこちらをご参照ください。
CustomLLM_02_02.png

  • 名前:使用するLLMの名称 (UI表示にのみ使用するため何でも構わない)
  • 説明:必要に応じてメモとして使用
  • モデル:ダウンロードしたモデルの名称
  • URL(*):カスタムLLMの立ち上げで表示されたURL(通常はlocalhost:1234に設定されます)
  • 最大トークン長:カスタムLLMの立ち上げで表示されたcontext_lengthの数値

(*)未記入の場合、HTTPの接続エラーになります。

ローカルLLMの処理速度を向上させる方法

画面右側の「Advanced Configration」内にある「GPU Settings」のパラメータ値を変更することでGPUメモリを使用する割合を変更することができます。
GPU Offloadパラメータを最大に設定すると、GPUメモリを使用した高速処理をおこなうことができます。
CustomLLM_09


次のページへ >

results matching ""

    No results matching ""