Structure d'objet Anthropic Vertex AI
LibreChat prend en charge l'exécution des modèles Anthropic Claude via Google Cloud Vertex AI. Cela vous permet d'utiliser les modèles Claude avec votre infrastructure, votre facturation et vos identifiants Google Cloud existants.
Avantages
- Facturation unifiée : Utilisez votre compte de facturation Google Cloud existant
- Fonctionnalités Entreprise : Accédez aux fonctionnalités de sécurité et de conformité d'entreprise de Google Cloud
- Conformité régionale : Déployez dans des régions spécifiques pour répondre aux exigences de résidence des données
- Infrastructure existante : Tirez parti de vos comptes de service GCP et de vos politiques IAM actuels
Prérequis
Avant de configurer Anthropic Vertex AI, assurez-vous d'avoir :
- Projet Google Cloud avec l'API Vertex AI activée
- Compte de service avec le rôle
Vertex AI User(roles/aiplatform.user) - Modèles Claude activés dans votre Vertex AI Model Garden
- Clé de compte de service (fichier JSON) téléchargée et accessible à LibreChat
Exemple de configuration
Note : L'endpoint Anthropic prend en charge tous les Shared Endpoint Settings, y compris
streamRate,titleModel,titleMethod,titlePrompt,titlePromptTemplateettitleEndpoint.
vertex
L'objet vertex contient toutes les options de configuration spécifiques à Vertex AI.
region
Clé :
| Key | Type | Description | Example |
|---|---|---|---|
| region | String | La région Google Cloud où votre endpoint Vertex AI est déployé. | Must be a region where Claude models are available on Vertex AI. |
Par défaut : us-east5
Régions disponibles :
global(recommandé pour la plupart des cas d'utilisation)us-east5us-central1europe-west1europe-west4asia-southeast1
Conseil : La région
globalest recommandée car elle permet un routage automatique vers la région disponible la plus proche. Utilisez des régions spécifiques uniquement si vous avez des exigences en matière de résidence des données.
Exemple :
projectId
Clé :
| Key | Type | Description | Example |
|---|---|---|---|
| projectId | String | L'ID du projet Google Cloud. Prend en charge les références aux variables d'environnement. | Optional. If not specified, auto-detected from the service account key file. |
Par défaut : Détecté automatiquement à partir du fichier de clé de service
Exemple :
serviceKeyFile
Clé :
| Key | Type | Description | Example |
|---|---|---|---|
| serviceKeyFile | String | Chemin d'accès au fichier JSON de la clé de compte de service Google Cloud. | Can be absolute or relative to the LibreChat root directory. |
Par défaut : api/data/auth.json (ou la variable d'environnement GOOGLE_SERVICE_KEY_FILE)
Exemple :
models
Le champ models définit les modèles Claude disponibles et associe des noms conviviaux aux identifiants de déploiement Vertex AI. Cela fonctionne de manière similaire au mappage de modèles Azure OpenAI.
Options de format
Vous pouvez configurer les modèles de trois manières :
Option 1 : Tableau simple
Utilisez directement les identifiants de modèle Vertex AI réels. Ceux-ci seront affichés tels quels dans l'interface utilisateur :
Option 2 : Objet avec des noms personnalisés (Recommandé)
Associez des noms conviviaux aux noms de déploiement Vertex AI :
Option 3 : Format mixte avec valeur par défaut
Définissez un nom de déploiement par défaut et utilisez des valeurs booléennes pour les modèles qui en héritent :
Propriétés de l'objet Model
| Key | Type | Description | Example |
|---|---|---|---|
| deploymentName | String | L'ID de modèle Vertex AI réel utilisé pour les appels API. | Required for each model unless using boolean `true` with a group-level default. |
Exemple :
Alternative aux variables d'environnement
Pour des configurations plus simples, vous pouvez configurer Vertex AI en utilisant des variables d'environnement au lieu du YAML :
Remarque : Lors de l'utilisation de variables d'environnement, le mappage de modèles n'est pas disponible. Tous les modèles Claude connus seront inclus automatiquement.
Exemples complets
Configuration de base
Configuration minimale utilisant les valeurs par défaut (Vertex AI est activé par la présence de la section vertex) :
Ceci utilise :
- Région :
us-east5 - Clé de service :
api/data/auth.json(ou variable d'environnementGOOGLE_SERVICE_KEY_FILE) - ID de projet : Détecté automatiquement à partir de la clé de service
- Modèles : Tous les modèles Claude connus
Configuration de production avec Model Mapping
Configuration complète avec des noms de modèles et des titres personnalisés :
Configuration multi-région
Vous ne pouvez configurer qu'une seule région par déploiement. Pour des besoins multi-régions, envisagez d'utiliser des instances LibreChat distinctes ou des endpoints personnalisés.
Dépannage
Erreurs courantes
"Impossible de charger les identifiants par défaut"
- Assurez-vous que le fichier de clé du compte de service existe au chemin spécifié
- Vérifiez les permissions de fichier (doivent être lisibles par le processus LibreChat)
- Vérifiez que le fichier JSON est valide et non corrompu
"Permission denied" ou "403 Forbidden"
- Vérifiez que le compte de service dispose du rôle
Vertex AI User - Assurez-vous que les modèles Claude sont activés dans votre Vertex AI Model Garden
- Vérifiez que le compte de service appartient au bon projet
"Modèle introuvable"
- Vérifiez que l'ID du modèle dans
deploymentNameest correct - Vérifiez que le modèle est disponible dans la région que vous avez sélectionnée
- Assurez-vous que le modèle est activé dans votre Vertex AI Model Garden
Problèmes de région
"Région invalide" ou "Région non prise en charge"
- Utilisez l'une des régions prises en charge listées ci-dessus
- Essayez d'utiliser la région
globalqui fournit un routage automatique - Consultez la documentation de Google Cloud pour obtenir la liste la plus récente des régions où Claude est disponible.
"Modèle non disponible dans la région"
- Tous les modèles Claude ne sont pas disponibles dans toutes les régions
- Essayez de passer à la région
globalpour un routage automatique vers une région disponible - Consultez le Vertex AI Model Garden pour voir quels modèles sont disponibles dans votre région
- Envisagez d'utiliser une région différente disposant d'une plus grande disponibilité de modèles (par exemple,
us-east5)
Problèmes de latence
- Si vous rencontrez une latence élevée, essayez d'utiliser une région géographiquement plus proche de vos utilisateurs.
- La région
globalachemine automatiquement vers la région disponible la plus proche - Pour les charges de travail en production avec des exigences de latence strictes, testez différentes régions et choisissez celle offrant les meilleures performances pour votre cas d'utilisation.
Vérification de la configuration
-
Assurez-vous que votre clé de compte de service est valide :
-
Tester l'accès à Vertex AI :
-
Vérifiez l'accès au modèle Claude :
Notes
- Vertex AI et l'API Anthropic directe sont mutuellement exclusifs. Lorsqu'une section de configuration
vertexest présente, la variable d'environnementANTHROPIC_API_KEYest ignorée. - La fonctionnalité de recherche Web est entièrement prise en charge avec Vertex AI.
- La mise en cache des prompts (Prompt caching) est prise en charge via le filtrage automatique des en-têtes pour la compatibilité avec Vertex AI.
- L'appel de fonctions (function calling) et l'utilisation d'outils fonctionnent de la même manière qu'avec l'API Anthropic directe.
Que pensez-vous de ce guide ?