vLLM
在 LibreChat 中将 vLLM 配置为自定义 endpoint。
vLLM 是一个用于 LLM 的高吞吐量、内存高效的推理和服务引擎。它提供了一个兼容 OpenAI 的 API,因此你可以在本地运行它,并将 LibreChat 指向你自己的服务器。
配置
本地 vLLM 部署不需要身份验证,因此 API key 仅作为占位符。将 baseURL 指向您正在运行的 vLLM 服务器。在 librechat.yaml 中的 endpoints.custom 下添加该 endpoint:
注意事项
- 此示例连接到端口 8023 上的本地 vLLM 服务器,并以 Gemma 3 27B 作为默认模型。请将
baseURL设置为您服务器运行的地址。 - 当设置
fetch: true时,LibreChat 会加载 vLLM 服务器上可用的完整模型列表,因此default仅作为初始选择。 titleMessageRole: "user"会覆盖用于生成标题的默认system角色。由于某些本地模型会拒绝 system 消息角色,因此将标题提示词作为 user 消息发送可以避免错误。
这篇指南怎么样?