Anthropic Vertex AI 对象结构
LibreChat 支持通过 Google Cloud Vertex AI 运行 Anthropic Claude 模型。这使您能够利用现有的 Google Cloud 基础设施、账单和凭据来使用 Claude 模型。
如需使用环境变量进行快速设置,请参阅 Anthropic 配置指南
优势
- 统一计费: 使用您现有的 Google Cloud 计费账户
- 企业级功能: 访问 Google Cloud 的企业级安全和合规功能
- 区域合规性: 在特定区域部署以满足数据驻留要求
- 现有基础设施: 利用您当前的 GCP 服务账号和 IAM 策略
先决条件
在配置 Anthropic Vertex AI 之前,请确保您已完成以下准备工作:
- 已启用 Vertex AI API 的 Google Cloud Project
- 服务账号,需具备
Vertex AI User角色 (roles/aiplatform.user) - 在您的 Vertex AI Model Garden 中启用的 Claude models
- Service Account Key (JSON 文件),已下载并可供 LibreChat 访问
示例配置
注意: Anthropic endpoint 支持所有 Shared Endpoint Settings,包括
streamRate、titleModel、titleMethod、titlePrompt、titlePromptTemplate和titleEndpoint。
vertex
vertex 对象包含所有 Vertex AI 特定的配置选项。
region
键:
| Key | Type | Description | Example |
|---|---|---|---|
| region | String | 部署您的 Vertex AI endpoint 的 Google Cloud 区域。 | Must be a region where Claude models are available on Vertex AI. |
默认值: us-east5
可用区域:
global(推荐用于大多数使用场景)us-east5us-central1europe-west1europe-west4asia-southeast1
提示: 建议使用
global区域,因为它会自动路由到最近的可用区域。仅在有数据驻留要求时才使用特定区域。
示例:
projectId
键:
| Key | Type | Description | Example |
|---|---|---|---|
| projectId | String | Google Cloud 项目 ID。支持环境变量引用。 | Optional. If not specified, auto-detected from the service account key file. |
默认值: 从服务密钥文件中自动检测
示例:
serviceKeyFile
键:
| Key | Type | Description | Example |
|---|---|---|---|
| serviceKeyFile | String | Google Cloud 服务账号密钥 JSON 文件的路径。 | Can be absolute or relative to the LibreChat root directory. |
默认值: api/data/auth.json(或 GOOGLE_SERVICE_KEY_FILE 环境变量)
示例:
models
models 字段定义了可用的 Claude 模型,并将用户友好的名称映射到 Vertex AI 部署 ID。其工作方式与 Azure OpenAI 模型映射 类似。
格式选项
您可以通过三种方式配置模型:
选项 1:简单数组
直接使用实际的 Vertex AI 模型 ID。这些 ID 将按原样显示在 UI 中:
选项 2:使用自定义名称的对象(推荐)
将用户友好的名称映射到 Vertex AI 部署名称:
选项 3:混合格式及默认值
设置一个默认的部署名称,并对继承该名称的模型使用布尔值:
模型对象属性
| Key | Type | Description | Example |
|---|---|---|---|
| deploymentName | String | 用于 API 调用的实际 Vertex AI 模型 ID。 | Required for each model unless using boolean `true` with a group-level default. |
示例:
环境变量替代方案
对于更简单的设置,您可以使用环境变量而不是 YAML 来配置 Vertex AI:
注意: 当使用环境变量时,模型映射功能不可用。所有已知的 Claude 模型都将被自动包含。
完整示例
基础设置
使用默认值的最小配置(通过 vertex 部分的存在启用 Vertex AI):
这使用了:
- 区域:
us-east5 - 服务密钥:
api/data/auth.json(或GOOGLE_SERVICE_KEY_FILE环境变量) - 项目 ID:从服务密钥中自动检测
- 模型:所有已知的 Claude 模型
使用 Model Mapping 的生产环境设置
包含自定义模型名称和标题的完整配置:
多区域设置
每个部署只能配置一个区域。如果需要多区域支持,请考虑使用独立的 LibreChat 实例或自定义 endpoint。
故障排除
常见错误
"无法加载默认凭据"
- 确保服务账号密钥文件存在于指定路径
- 检查文件权限(必须可被 LibreChat 进程读取)
- 验证 JSON 文件是否有效且未损坏
“Permission denied” 或 “403 Forbidden”
- 验证服务账号是否拥有
Vertex AI User角色 - 确保 Claude 模型已在您的 Vertex AI Model Garden 中启用
- 检查服务账号是否属于正确的项目
"未找到模型"
- 检查
deploymentName中的模型 ID 是否正确 - 验证该模型在您选择的区域内是否可用
- 确保该模型已在您的 Vertex AI Model Garden 中启用
区域问题
“Invalid region” 或 “Region not supported”
- 使用上述列出的受支持区域之一
- 尝试使用
global区域,它提供自动路由功能 - 请查看 Google Cloud 的文档 以获取 Claude 可用区域的最新列表。
“模型在当前区域不可用”
- 并非所有 Claude 模型在所有地区都可用
- 尝试切换到
global区域,以便自动路由到可用区域 - 请查看 Vertex AI Model Garden 以了解您所在区域可用的模型。
- 考虑使用模型可用性更广的其他区域(例如
us-east5)。
延迟问题
- 如果您遇到高延迟,请尝试使用地理位置更靠近您用户的区域。
global区域会自动路由至最近的可用区域- 对于有严格延迟要求的生产工作负载,请测试不同的区域并选择最适合您用例的区域以获得最佳性能。
验证设置
-
确保您的服务账号密钥有效:
-
测试 Vertex AI 访问:
-
验证 Claude 模型访问权限:
注意事项
- Vertex AI 和直接的 Anthropic API 是互斥的。当存在
vertex配置部分时,ANTHROPIC_API_KEY环境变量将被忽略。 - Vertex AI 完全支持网络搜索功能。
- 通过自动标头过滤支持 Prompt caching,以实现与 Vertex AI 的兼容性。
- Function calling 和 tool use 的工作方式与直接使用 Anthropic API 时相同。
这篇指南怎么样?