Struttura dell'oggetto Anthropic Vertex AI
LibreChat supporta l'esecuzione dei modelli Anthropic Claude tramite Google Cloud Vertex AI. Ciò ti consente di utilizzare i modelli Claude con la tua infrastruttura, fatturazione e credenziali Google Cloud esistenti.
Vantaggi
- Fatturazione unificata: utilizza il tuo account di fatturazione Google Cloud esistente
- Funzionalità Enterprise: Accedi alle funzionalità di sicurezza e conformità enterprise di Google Cloud
- Conformità regionale: Distribuisci in regioni specifiche per soddisfare i requisiti di residenza dei dati
- Infrastruttura esistente: Sfrutta i tuoi account di servizio GCP e le policy IAM attuali
Prerequisiti
Prima di configurare Anthropic Vertex AI, assicurati di avere:
- Google Cloud Project con l'API Vertex AI abilitata
- Service Account con il ruolo
Vertex AI User(roles/aiplatform.user) - Modelli Claude abilitati nel tuo Vertex AI Model Garden
- Service Account Key (file JSON) scaricata e accessibile a LibreChat
Esempio di configurazione
endpoints:
anthropic:
streamRate: 20
titleModel: "claude-3.5-haiku" # Use the visible model name (key from models config)
vertex:
region: "us-east5"
# serviceKeyFile: "/path/to/service-account.json" # Optional, defaults to api/data/auth.json
# projectId: "${VERTEX_PROJECT_ID}" # Optional, auto-detected from service key
# Model mapping: visible name -> Vertex AI deployment name
models:
claude-opus-4.5:
deploymentName: claude-opus-4-5@20251101
claude-sonnet-4:
deploymentName: claude-sonnet-4-20250514
claude-3.7-sonnet:
deploymentName: claude-3-7-sonnet-20250219
claude-3.5-sonnet:
deploymentName: claude-3-5-sonnet-v2@20241022
claude-3.5-haiku:
deploymentName: claude-3-5-haiku@20241022Nota: L'endpoint Anthropic supporta tutte le Shared Endpoint Settings, incluse
streamRate,titleModel,titleMethod,titlePrompt,titlePromptTemplateetitleEndpoint.
vertex
L'oggetto vertex contiene tutte le opzioni di configurazione specifiche per Vertex AI.
region
Chiave:
| Key | Type | Description | Example |
|---|---|---|---|
| region | String | La regione Google Cloud in cui è distribuito il tuo endpoint Vertex AI. | Must be a region where Claude models are available on Vertex AI. |
Predefinito: us-east5
Regioni disponibili:
global(consigliato per la maggior parte dei casi d'uso)us-east5us-central1europe-west1europe-west4asia-southeast1
Suggerimento: La regione
globalè consigliata poiché fornisce un instradamento automatico verso la regione disponibile più vicina. Utilizza regioni specifiche solo se hai requisiti di residenza dei dati.
Esempio:
region: "global"projectId
Chiave:
| Key | Type | Description | Example |
|---|---|---|---|
| projectId | String | L'ID del Google Cloud Project. Supporta i riferimenti alle variabili d'ambiente. | Optional. If not specified, auto-detected from the service account key file. |
Predefinito: Rilevato automaticamente dal file della chiave del servizio
Esempio:
projectId: "${GOOGLE_PROJECT_ID}"serviceKeyFile
Chiave:
| Key | Type | Description | Example |
|---|---|---|---|
| serviceKeyFile | String | Percorso del file JSON della chiave dell'account di servizio Google Cloud. | Can be absolute or relative to the LibreChat root directory. |
Predefinito: api/data/auth.json (o variabile d'ambiente GOOGLE_SERVICE_KEY_FILE)
Esempio:
serviceKeyFile: "/etc/secrets/gcp-service-account.json"models
Il campo models definisce i modelli Claude disponibili e associa nomi intuitivi agli ID di distribuzione di Vertex AI. Questo funziona in modo simile al mapping dei modelli di Azure OpenAI.
Opzioni di formato
Puoi configurare i modelli in tre modi:
Opzione 1: Array semplice
Utilizza direttamente gli ID modello effettivi di Vertex AI. Questi verranno mostrati così come sono nell'interfaccia utente:
models:
- "claude-sonnet-4-20250514"
- "claude-3-7-sonnet-20250219"
- "claude-3-5-haiku@20241022"Opzione 2: Oggetto con Nomi Personalizzati (Consigliato)
Associa nomi intuitivi ai nomi di distribuzione di Vertex AI:
models:
claude-opus-4.5: # Visible in UI
deploymentName: claude-opus-4-5@20251101 # Actual Vertex AI model ID
claude-sonnet-4:
deploymentName: claude-sonnet-4-20250514
claude-3.5-haiku:
deploymentName: claude-3-5-haiku@20241022Opzione 3: Formato misto con predefinito
Imposta un nome di distribuzione predefinito e utilizza valori booleani per i modelli che lo ereditano:
deploymentName: claude-sonnet-4-20250514 # Default deployment
models:
claude-sonnet-4: true # Uses default deploymentName
claude-3.5-haiku:
deploymentName: claude-3-5-haiku@20241022 # Override for this modelProprietà dell'oggetto Model
| Key | Type | Description | Example |
|---|---|---|---|
| deploymentName | String | L'ID effettivo del modello Vertex AI utilizzato per le chiamate API. | Required for each model unless using boolean `true` with a group-level default. |
Esempio:
models:
claude-sonnet-4:
deploymentName: claude-sonnet-4-20250514Alternativa alle variabili d'ambiente
Per configurazioni più semplici, è possibile configurare Vertex AI utilizzando le variabili d'ambiente invece del file YAML:
# Enable Vertex AI mode
ANTHROPIC_USE_VERTEX=true
# Vertex AI region (optional, defaults to us-east5)
ANTHROPIC_VERTEX_REGION=global
# Path to service account key (optional, defaults to api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.jsonNota: Quando si utilizzano le variabili d'ambiente, il model mapping non è disponibile. Tutti i modelli Claude conosciuti verranno inclusi automaticamente.
Esempi completi
Configurazione di base
Configurazione minima utilizzando i valori predefiniti (Vertex AI è abilitato dalla presenza della sezione vertex):
endpoints:
anthropic:
vertex:
region: us-east5Questo utilizza:
- Regione:
us-east5 - Chiave di servizio:
api/data/auth.json(o variabile d'ambienteGOOGLE_SERVICE_KEY_FILE) - ID Progetto: Rilevato automaticamente dalla chiave di servizio
- Modelli: Tutti i modelli Claude conosciuti
Configurazione di produzione con Model Mapping
Configurazione completa con nomi e titoli dei modelli personalizzati:
endpoints:
anthropic:
streamRate: 20
titleModel: "haiku"
titleMethod: "completion"
vertex:
region: "global"
serviceKeyFile: "${GOOGLE_SERVICE_KEY_FILE}"
models:
opus:
deploymentName: claude-opus-4-5@20251101
sonnet:
deploymentName: claude-sonnet-4-20250514
haiku:
deploymentName: claude-3-5-haiku@20241022Configurazione Multi-Regione
È possibile configurare solo una regione per deployment. Per esigenze multi-regione, si consiglia di utilizzare istanze LibreChat separate o endpoint personalizzati.
Risoluzione dei problemi
Errori comuni
"Impossibile caricare le credenziali predefinite"
- Assicurati che il file della chiave dell'account di servizio esista nel percorso specificato
- Controlla i permessi dei file (devono essere leggibili dal processo LibreChat)
- Verifica che il file JSON sia valido e non corrotto
"Permission denied" o "403 Forbidden"
- Verifica che l'account di servizio abbia il ruolo
Vertex AI User - Assicurati che i modelli Claude siano abilitati nel tuo Vertex AI Model Garden
- Verifica che l'account di servizio appartenga al progetto corretto
"Modello non trovato"
- Controlla che l'ID del modello in
deploymentNamesia corretto - Verifica che il modello sia disponibile nella regione selezionata
- Assicurati che il modello sia abilitato nel tuo Vertex AI Model Garden
Problemi di regione
"Regione non valida" o "Regione non supportata"
- Utilizza una delle regioni supportate elencate sopra
- Prova a utilizzare la regione
globalche fornisce il routing automatico - Consulta la documentazione di Google Cloud per l'elenco aggiornato delle regioni in cui Claude è disponibile.
"Modello non disponibile nella regione"
- Non tutti i modelli Claude sono disponibili in tutte le regioni
- Prova a passare alla regione
globalper il routing automatico verso una regione disponibile - Controlla il Vertex AI Model Garden per vedere quali modelli sono disponibili nella tua regione
- Prendi in considerazione l'utilizzo di una regione diversa che abbia una maggiore disponibilità di modelli (ad esempio,
us-east5)
Problemi di latenza
- Se riscontri una latenza elevata, prova a utilizzare una regione geograficamente più vicina ai tuoi utenti
- La regione
globalinstrada automaticamente verso la regione disponibile più vicina - Per carichi di lavoro in produzione con requisiti di latenza rigorosi, testa diverse regioni e scegli quella con le migliori prestazioni per il tuo caso d'uso.
Verifica della configurazione
-
Assicurati che la chiave del tuo account di servizio sia valida:
gcloud auth activate-service-account --key-file=/path/to/key.json gcloud auth list -
Testa l'accesso a Vertex AI:
gcloud ai models list --region=us-east5 -
Verifica l'accesso al modello Claude:
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://us-east5-aiplatform.googleapis.com/v1/projects/YOUR_PROJECT/locations/us-east5/publishers/anthropic/models/claude-3-5-haiku@20241022:rawPredict" \ -d '{"anthropic_version": "vertex-2023-10-16", "max_tokens": 100, "messages": [{"role": "user", "content": "Hello"}]}'
Note
- Vertex AI e l'API Anthropic diretta sono mutuamente esclusivi. Quando è presente una sezione di configurazione
vertex, la variabile d'ambienteANTHROPIC_API_KEYviene ignorata. - La funzionalità di ricerca web è pienamente supportata con Vertex AI.
- Il prompt caching è supportato tramite il filtraggio automatico delle intestazioni per la compatibilità con Vertex AI.
- Il function calling e l'utilizzo dei tool funzionano allo stesso modo dell'API Anthropic diretta.
Com’è questa guida?