Structure d'objet Anthropic Vertex AI

LibreChat prend en charge l'exécution des modèles Anthropic Claude via Google Cloud Vertex AI. Cela vous permet d'utiliser les modèles Claude avec votre infrastructure, votre facturation et vos identifiants Google Cloud existants.

Pour une configuration rapide à l'aide de variables d'environnement, consultez le guide de configuration Anthropic

Avantages

Facturation unifiée : Utilisez votre compte de facturation Google Cloud existant
Fonctionnalités Entreprise : Accédez aux fonctionnalités de sécurité et de conformité d'entreprise de Google Cloud
Conformité régionale : Déployez dans des régions spécifiques pour répondre aux exigences de résidence des données
Infrastructure existante : Tirez parti de vos comptes de service GCP et de vos politiques IAM actuels

Prérequis

Avant de configurer Anthropic Vertex AI, assurez-vous d'avoir :

Projet Google Cloud avec l'API Vertex AI activée
Compte de service avec le rôle Vertex AI User (roles/aiplatform.user)
Modèles Claude activés dans votre Vertex AI Model Garden
Clé de compte de service (fichier JSON) téléchargée et accessible à LibreChat

Exemple de configuration

endpoints:
  anthropic:
    streamRate: 20
    titleModel: "claude-3.5-haiku"  # Use the visible model name (key from models config)
 
    vertex:
      region: "us-east5"
      # serviceKeyFile: "/path/to/service-account.json"  # Optional, defaults to api/data/auth.json
      # projectId: "${VERTEX_PROJECT_ID}"  # Optional, auto-detected from service key
 
      # Model mapping: visible name -> Vertex AI deployment name
      models:
        claude-opus-4.5:
          deploymentName: claude-opus-4-5@20251101
        claude-sonnet-4:
          deploymentName: claude-sonnet-4-20250514
        claude-3.7-sonnet:
          deploymentName: claude-3-7-sonnet-20250219
        claude-3.5-sonnet:
          deploymentName: claude-3-5-sonnet-v2@20241022
        claude-3.5-haiku:
          deploymentName: claude-3-5-haiku@20241022

Note : L'endpoint Anthropic prend en charge tous les Shared Endpoint Settings, y compris streamRate, titleModel, titleMethod, titlePrompt, titlePromptTemplate et titleEndpoint.

vertex

L'objet vertex contient toutes les options de configuration spécifiques à Vertex AI.

region

Clé :

Key	Type	Description	Example
region	String	La région Google Cloud où votre endpoint Vertex AI est déployé.	Must be a region where Claude models are available on Vertex AI.

Par défaut : us-east5

Régions disponibles :

global (recommandé pour la plupart des cas d'utilisation)
us-east5
us-central1
europe-west1
europe-west4
asia-southeast1

Conseil : La région global est recommandée car elle permet un routage automatique vers la région disponible la plus proche. Utilisez des régions spécifiques uniquement si vous avez des exigences en matière de résidence des données.

Exemple :

region: "global"

projectId

Clé :

Key	Type	Description	Example
projectId	String	L'ID du projet Google Cloud. Prend en charge les références aux variables d'environnement.	Optional. If not specified, auto-detected from the service account key file.

Par défaut : Détecté automatiquement à partir du fichier de clé de service

Exemple :

projectId: "${GOOGLE_PROJECT_ID}"

serviceKeyFile

Clé :

Key	Type	Description	Example
serviceKeyFile	String	Chemin d'accès au fichier JSON de la clé de compte de service Google Cloud.	Can be absolute or relative to the LibreChat root directory.

Par défaut : api/data/auth.json (ou la variable d'environnement GOOGLE_SERVICE_KEY_FILE)

Exemple :

serviceKeyFile: "/etc/secrets/gcp-service-account.json"

models

Le champ models définit les modèles Claude disponibles et associe des noms conviviaux aux identifiants de déploiement Vertex AI. Cela fonctionne de manière similaire au mappage de modèles Azure OpenAI.

Options de format

Vous pouvez configurer les modèles de trois manières :

Option 1 : Tableau simple

Utilisez directement les identifiants de modèle Vertex AI réels. Ceux-ci seront affichés tels quels dans l'interface utilisateur :

models:
  - "claude-sonnet-4-20250514"
  - "claude-3-7-sonnet-20250219"
  - "claude-3-5-haiku@20241022"

Option 2 : Objet avec des noms personnalisés (Recommandé)

Associez des noms conviviaux aux noms de déploiement Vertex AI :

models:
  claude-opus-4.5:           # Visible in UI
    deploymentName: claude-opus-4-5@20251101  # Actual Vertex AI model ID
  claude-sonnet-4:
    deploymentName: claude-sonnet-4-20250514
  claude-3.5-haiku:
    deploymentName: claude-3-5-haiku@20241022

Option 3 : Format mixte avec valeur par défaut

Définissez un nom de déploiement par défaut et utilisez des valeurs booléennes pour les modèles qui en héritent :

deploymentName: claude-sonnet-4-20250514  # Default deployment
models:
  claude-sonnet-4: true  # Uses default deploymentName
  claude-3.5-haiku:
    deploymentName: claude-3-5-haiku@20241022  # Override for this model

Propriétés de l'objet Model

Key	Type	Description	Example
deploymentName	String	L'ID de modèle Vertex AI réel utilisé pour les appels API.	Required for each model unless using boolean `true` with a group-level default.

Exemple :

models:
  claude-sonnet-4:
    deploymentName: claude-sonnet-4-20250514

Alternative aux variables d'environnement

Pour des configurations plus simples, vous pouvez configurer Vertex AI en utilisant des variables d'environnement au lieu du YAML :

# Enable Vertex AI mode
ANTHROPIC_USE_VERTEX=true
 
# Vertex AI region (optional, defaults to us-east5)
ANTHROPIC_VERTEX_REGION=global
 
# Path to service account key (optional, defaults to api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.json

Remarque : Lors de l'utilisation de variables d'environnement, le mappage de modèles n'est pas disponible. Tous les modèles Claude connus seront inclus automatiquement.

Exemples complets

Configuration de base

Configuration minimale utilisant les valeurs par défaut (Vertex AI est activé par la présence de la section vertex) :

endpoints:
  anthropic:
    vertex:
      region: us-east5

Ceci utilise :

Région : us-east5
Clé de service : api/data/auth.json (ou variable d'environnement GOOGLE_SERVICE_KEY_FILE)
ID de projet : Détecté automatiquement à partir de la clé de service
Modèles : Tous les modèles Claude connus

Configuration de production avec Model Mapping

Configuration complète avec des noms de modèles et des titres personnalisés :

endpoints:
  anthropic:
    streamRate: 20
    titleModel: "haiku"
    titleMethod: "completion"
 
    vertex:
      region: "global"
      serviceKeyFile: "${GOOGLE_SERVICE_KEY_FILE}"
 
      models:
        opus:
          deploymentName: claude-opus-4-5@20251101
        sonnet:
          deploymentName: claude-sonnet-4-20250514
        haiku:
          deploymentName: claude-3-5-haiku@20241022

Assurez-vous que le fichier de clé du compte de service existe au chemin spécifié
Vérifiez les permissions de fichier (doivent être lisibles par le processus LibreChat)
Vérifiez que le fichier JSON est valide et non corrompu

"Permission denied" ou "403 Forbidden"

Vérifiez que le compte de service dispose du rôle Vertex AI User
Assurez-vous que les modèles Claude sont activés dans votre Vertex AI Model Garden
Vérifiez que le compte de service appartient au bon projet

"Modèle introuvable"

Vérifiez que l'ID du modèle dans deploymentName est correct
Vérifiez que le modèle est disponible dans la région que vous avez sélectionnée
Assurez-vous que le modèle est activé dans votre Vertex AI Model Garden

Problèmes de région

"Région invalide" ou "Région non prise en charge"

Utilisez l'une des régions prises en charge listées ci-dessus
Essayez d'utiliser la région global qui fournit un routage automatique
Consultez la documentation de Google Cloud pour obtenir la liste la plus récente des régions où Claude est disponible.

"Modèle non disponible dans la région"

Tous les modèles Claude ne sont pas disponibles dans toutes les régions
Essayez de passer à la région global pour un routage automatique vers une région disponible
Consultez le Vertex AI Model Garden pour voir quels modèles sont disponibles dans votre région
Envisagez d'utiliser une région différente disposant d'une plus grande disponibilité de modèles (par exemple, us-east5)

Problèmes de latence

Si vous rencontrez une latence élevée, essayez d'utiliser une région géographiquement plus proche de vos utilisateurs.
La région global achemine automatiquement vers la région disponible la plus proche
Pour les charges de travail en production avec des exigences de latence strictes, testez différentes régions et choisissez celle offrant les meilleures performances pour votre cas d'utilisation.

Vérification de la configuration

Assurez-vous que votre clé de compte de service est valide :
gcloud auth activate-service-account --key-file=/path/to/key.json gcloud auth list
Tester l'accès à Vertex AI :
gcloud ai models list --region=us-east5

Vérifiez l'accès au modèle Claude :

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://us-east5-aiplatform.googleapis.com/v1/projects/YOUR_PROJECT/locations/us-east5/publishers/anthropic/models/claude-3-5-haiku@20241022:rawPredict" \
  -d '{"anthropic_version": "vertex-2023-10-16", "max_tokens": 100, "messages": [{"role": "user", "content": "Hello"}]}'

Notes

Vertex AI et l'API Anthropic directe sont mutuellement exclusifs. Lorsqu'une section de configuration vertex est présente, la variable d'environnement ANTHROPIC_API_KEY est ignorée.
La fonctionnalité de recherche Web est entièrement prise en charge avec Vertex AI.
La mise en cache des prompts (Prompt caching) est prise en charge via le filtrage automatique des en-têtes pour la compatibilité avec Vertex AI.
L'appel de fonctions (function calling) et l'utilisation d'outils fonctionnent de la même manière qu'avec l'API Anthropic directe.

Structure d'objet Anthropic Vertex AI

Avantages

Prérequis

Exemple de configuration

vertex

region

projectId

serviceKeyFile

models

Options de format

Option 1 : Tableau simple

Option 2 : Objet avec des noms personnalisés (Recommandé)

Option 3 : Format mixte avec valeur par défaut

Propriétés de l'objet Model

Alternative aux variables d'environnement

Exemples complets

Configuration de base

Configuration de production avec Model Mapping

Configuration multi-région

Dépannage

Erreurs courantes

Problèmes de région

Vérification de la configuration

Notes