Estrutura de Objeto do Anthropic Vertex AI
O LibreChat oferece suporte à execução de modelos Anthropic Claude por meio do Google Cloud Vertex AI. Isso permite que você utilize modelos Claude com sua infraestrutura, faturamento e credenciais existentes do Google Cloud.
BenefÃcios
- Faturamento Unificado: Use sua conta de faturamento do Google Cloud existente
- Recursos Corporativos: Acesse os recursos de segurança e conformidade corporativa do Google Cloud
- Conformidade Regional: Implante em regiões especÃficas para atender aos requisitos de residência de dados
- Infraestrutura Existente: Aproveite suas contas de serviço e polÃticas de IAM do GCP atuais
Pré-requisitos
Antes de configurar o Anthropic Vertex AI, certifique-se de que você tenha:
- Google Cloud Project com a Vertex AI API habilitada
- Service Account com a função
Vertex AI User(roles/aiplatform.user) - Modelos Claude habilitados no seu Vertex AI Model Garden
- Service Account Key (arquivo JSON) baixada e acessÃvel ao LibreChat
Exemplo de Configuração
endpoints:
anthropic:
streamRate: 20
titleModel: "claude-3.5-haiku" # Use the visible model name (key from models config)
vertex:
region: "us-east5"
# serviceKeyFile: "/path/to/service-account.json" # Optional, defaults to api/data/auth.json
# projectId: "${VERTEX_PROJECT_ID}" # Optional, auto-detected from service key
# Model mapping: visible name -> Vertex AI deployment name
models:
claude-opus-4.5:
deploymentName: claude-opus-4-5@20251101
claude-sonnet-4:
deploymentName: claude-sonnet-4-20250514
claude-3.7-sonnet:
deploymentName: claude-3-7-sonnet-20250219
claude-3.5-sonnet:
deploymentName: claude-3-5-sonnet-v2@20241022
claude-3.5-haiku:
deploymentName: claude-3-5-haiku@20241022Nota: O endpoint da Anthropic suporta todas as Shared Endpoint Settings, incluindo
streamRate,titleModel,titleMethod,titlePrompt,titlePromptTemplateetitleEndpoint.
vertex
O objeto vertex contém todas as opções de configuração especÃficas do Vertex AI.
region
Chave:
| Key | Type | Description | Example |
|---|---|---|---|
| region | String | A região do Google Cloud onde seu endpoint Vertex AI está implantado. | Must be a region where Claude models are available on Vertex AI. |
Padrão: us-east5
Regiões DisponÃveis:
global(recomendado para a maioria dos casos de uso)us-east5us-central1europe-west1europe-west4asia-southeast1
Dica: A região
globalé recomendada, pois fornece roteamento automático para a região disponÃvel mais próxima. Use regiões especÃficas apenas se você tiver requisitos de residência de dados.
Exemplo:
region: "global"projectId
Chave:
| Key | Type | Description | Example |
|---|---|---|---|
| projectId | String | O ID do Google Cloud Project. Suporta referências a variáveis de ambiente. | Optional. If not specified, auto-detected from the service account key file. |
Padrão: Detectado automaticamente a partir do arquivo de chave de serviço
Exemplo:
projectId: "${GOOGLE_PROJECT_ID}"serviceKeyFile
Chave:
| Key | Type | Description | Example |
|---|---|---|---|
| serviceKeyFile | String | Caminho para o arquivo JSON da chave da conta de serviço do Google Cloud. | Can be absolute or relative to the LibreChat root directory. |
Padrão: api/data/auth.json (ou variável de ambiente GOOGLE_SERVICE_KEY_FILE)
Exemplo:
serviceKeyFile: "/etc/secrets/gcp-service-account.json"models
O campo models define os modelos Claude disponÃveis e mapeia nomes amigáveis para IDs de implantação do Vertex AI. Isso funciona de forma semelhante ao mapeamento de modelos do Azure OpenAI.
Opções de Formato
Você pode configurar modelos de três maneiras:
Opção 1: Array Simples
Use os IDs de modelo reais do Vertex AI diretamente. Eles serão exibidos como estão na interface:
models:
- "claude-sonnet-4-20250514"
- "claude-3-7-sonnet-20250219"
- "claude-3-5-haiku@20241022"Opção 2: Objeto com Nomes Personalizados (Recomendado)
Mapeie nomes amigáveis para nomes de implantação do Vertex AI:
models:
claude-opus-4.5: # Visible in UI
deploymentName: claude-opus-4-5@20251101 # Actual Vertex AI model ID
claude-sonnet-4:
deploymentName: claude-sonnet-4-20250514
claude-3.5-haiku:
deploymentName: claude-3-5-haiku@20241022Opção 3: Formato Misto com Padrão
Defina um nome de implantação padrão e use valores booleanos para modelos que o herdam:
deploymentName: claude-sonnet-4-20250514 # Default deployment
models:
claude-sonnet-4: true # Uses default deploymentName
claude-3.5-haiku:
deploymentName: claude-3-5-haiku@20241022 # Override for this modelPropriedades do Objeto Model
| Key | Type | Description | Example |
|---|---|---|---|
| deploymentName | String | O ID do modelo Vertex AI real usado para chamadas de API. | Required for each model unless using boolean `true` with a group-level default. |
Exemplo:
models:
claude-sonnet-4:
deploymentName: claude-sonnet-4-20250514Alternativa de Variável de Ambiente
Para configurações mais simples, você pode configurar o Vertex AI usando variáveis de ambiente em vez de YAML:
# Enable Vertex AI mode
ANTHROPIC_USE_VERTEX=true
# Vertex AI region (optional, defaults to us-east5)
ANTHROPIC_VERTEX_REGION=global
# Path to service account key (optional, defaults to api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.jsonNota: Ao usar variáveis de ambiente, o mapeamento de modelos não está disponÃvel. Todos os modelos Claude conhecidos serão incluÃdos automaticamente.
Exemplos Completos
Configuração Básica
Configuração mÃnima usando os padrões (Vertex AI é habilitado pela presença da seção vertex):
endpoints:
anthropic:
vertex:
region: us-east5Isso utiliza:
- Região:
us-east5 - Chave de serviço:
api/data/auth.json(ou variável de ambienteGOOGLE_SERVICE_KEY_FILE) - ID do Projeto: Detectado automaticamente a partir da chave de serviço
- Modelos: Todos os modelos Claude conhecidos
Configuração de Produção com Model Mapping
Configuração completa com nomes e tÃtulos de modelos personalizados:
endpoints:
anthropic:
streamRate: 20
titleModel: "haiku"
titleMethod: "completion"
vertex:
region: "global"
serviceKeyFile: "${GOOGLE_SERVICE_KEY_FILE}"
models:
opus:
deploymentName: claude-opus-4-5@20251101
sonnet:
deploymentName: claude-sonnet-4-20250514
haiku:
deploymentName: claude-3-5-haiku@20241022Configuração Multi-Região
Você só pode configurar uma região por implantação. Para necessidades de múltiplas regiões, considere usar instâncias separadas do LibreChat ou endpoints personalizados.
Solução de problemas
Erros Comuns
"Não foi possÃvel carregar as credenciais padrão"
- Certifique-se de que o arquivo de chave da conta de serviço exista no caminho especificado
- Verifique as permissões de arquivo (devem ser legÃveis pelo processo do LibreChat)
- Verifique se o arquivo JSON é válido e não está corrompido
"Permission denied" ou "403 Forbidden"
- Verifique se a conta de serviço possui a função
Vertex AI User - Certifique-se de que os modelos Claude estejam habilitados no seu Vertex AI Model Garden
- Verifique se a conta de serviço pertence ao projeto correto
"Modelo não encontrado"
- Verifique se o ID do modelo em
deploymentNameestá correto - Verifique se o modelo está disponÃvel na região selecionada
- Certifique-se de que o modelo esteja habilitado no seu Vertex AI Model Garden
Problemas de Região
"Região inválida" ou "Região não suportada"
- Use uma das regiões suportadas listadas acima
- Tente usar a região
global, que oferece roteamento automático - Consulte a documentação do Google Cloud para obter a lista mais recente de regiões onde o Claude está disponÃvel.
"Modelo não disponÃvel na região"
- Nem todos os modelos Claude estão disponÃveis em todas as regiões
- Tente mudar para a região
globalpara roteamento automático para uma região disponÃvel - Verifique o Vertex AI Model Garden para ver quais modelos estão disponÃveis em sua região
- Considere usar uma região diferente que tenha maior disponibilidade de modelos (por exemplo,
us-east5)
Problemas de latência
- Se você estiver enfrentando alta latência, tente usar uma região geograficamente mais próxima aos seus usuários
- A região
globalroteia automaticamente para a região disponÃvel mais próxima - Para cargas de trabalho em produção com requisitos rigorosos de latência, teste diferentes regiões e escolha aquela com o melhor desempenho para o seu caso de uso.
Verificando a Configuração
-
Certifique-se de que a chave da sua conta de serviço seja válida:
gcloud auth activate-service-account --key-file=/path/to/key.json gcloud auth list -
Testar acesso ao Vertex AI:
gcloud ai models list --region=us-east5 -
Verifique o acesso ao modelo Claude:
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://us-east5-aiplatform.googleapis.com/v1/projects/YOUR_PROJECT/locations/us-east5/publishers/anthropic/models/claude-3-5-haiku@20241022:rawPredict" \ -d '{"anthropic_version": "vertex-2023-10-16", "max_tokens": 100, "messages": [{"role": "user", "content": "Hello"}]}'
Notas
- Vertex AI e a API direta da Anthropic são mutuamente exclusivos. Quando uma seção de configuração
vertexestá presente, a variável de ambienteANTHROPIC_API_KEYé ignorada. - A funcionalidade de pesquisa na web é totalmente suportada com Vertex AI.
- O prompt caching é suportado via filtragem automática de cabeçalhos para compatibilidade com o Vertex AI.
- Function calling e o uso de ferramentas funcionam da mesma forma que com a API direta da Anthropic.
Como está este guia?