Ollama
LibreChatでOllamaをカスタムendpointとして設定する。
Ollamaはオープンモデルをローカルで実行し、OpenAI互換のAPIを公開するため、LibreChatを自身のマシンに向けることができます。ollama run <model> でモデルをダウンロードし、Ollama Library で利用可能なモデルを確認してください。
設定
OllamaはAPIキーを無視しますが、フィールドが存在することは期待するため、任意のプレースホルダーを設定してください。baseURLをOllamaサーバーに向けてください。librechat.yamlのendpoints.customの下にエンドポイントを追加します:
注記
titleModelを"current_model"に設定すると、タイトル生成時に2つ目のモデルを読み込むのではなく、会話で使用しているモデルを再利用するようになります。これにより、Ollamaにおいて会話ごとに読み込まれるモデルを1つに抑えることができます。- 上記の
default配列は、一般的なモデルのサンプルリストです。fetch: trueを設定すると、LibreChat はサーバーから完全なリストを取得します。
Ollama -> llama3
default parameters から stop が削除されたため、以下の問題は発生しなくなるはずです。
llama3 が停止せずに生成し続ける場合は、addParams ブロックに停止シーケンスを追加してください:
Ollamaで llama3 のみを実行する場合は、addParams を介して設定レベルで stop を指定しても問題ありません。複数のモデルを実行する場合は、代わりに会話パラメータやプリセットを通じてフロントエンドから停止シーケンスを追加し、addParams は省略してください。
会話パラメータで停止シーケンスを設定し(プリセットとして保存し)ます:
このガイドはいかがでしたか?