Anthropic Vertex AI Objektstruktur
LibreChat unterstützt die Ausführung von Anthropic Claude Modellen über Google Cloud Vertex AI. Dies ermöglicht es Ihnen, Claude Modelle mit Ihrer bestehenden Google Cloud Infrastruktur, Abrechnung und Ihren Anmeldedaten zu verwenden.
Vorteile
- Einheitliche Abrechnung: Verwenden Sie Ihr bestehendes Google Cloud-Abrechnungskonto
- Enterprise-Funktionen: Zugriff auf die Sicherheits- und Compliance-Funktionen von Google Cloud für Unternehmen
- Regionale Compliance: Bereitstellung in spezifischen Regionen, um Anforderungen an die Datenresidenz zu erfüllen
- Bestehende Infrastruktur: Nutzen Sie Ihre aktuellen GCP-Dienstkonten und IAM-Richtlinien
Voraussetzungen
Bevor Sie Anthropic Vertex AI konfigurieren, stellen Sie sicher, dass Sie Folgendes haben:
- Google Cloud Project mit aktivierter Vertex AI API
- Dienstkonto mit der Rolle
Vertex AI User(roles/aiplatform.user) - Claude-Modelle, die in Ihrem Vertex AI Model Garden aktiviert sind
- Service Account Key (JSON-Datei), heruntergeladen und für LibreChat zugänglich
Beispielkonfiguration
Hinweis: Der Anthropic endpoint unterstützt alle Shared Endpoint Settings, einschließlich
streamRate,titleModel,titleMethod,titlePrompt,titlePromptTemplateundtitleEndpoint.
vertex
Das vertex Objekt enthält alle Vertex AI-spezifischen Konfigurationsoptionen.
region
Schlüssel:
| Key | Type | Description | Example |
|---|---|---|---|
| region | String | Die Google Cloud-Region, in der Ihr Vertex AI endpoint bereitgestellt wird. | Must be a region where Claude models are available on Vertex AI. |
Standard: us-east5
Verfügbare Regionen:
global(für die meisten Anwendungsfälle empfohlen)us-east5us-central1europe-west1europe-west4asia-southeast1
Tipp: Die
globalRegion wird empfohlen, da sie ein automatisches Routing zur nächstgelegenen verfügbaren Region bietet. Verwenden Sie spezifische Regionen nur, wenn Sie Anforderungen an die Datenresidenz haben.
Beispiel:
projectId
Schlüssel:
| Key | Type | Description | Example |
|---|---|---|---|
| projectId | String | Die Google Cloud Project ID. Unterstützt Referenzen auf Umgebungsvariablen. | Optional. If not specified, auto-detected from the service account key file. |
Standard: Automatisch aus der Dienstschlüsseldatei erkannt
Beispiel:
serviceKeyFile
Schlüssel:
| Key | Type | Description | Example |
|---|---|---|---|
| serviceKeyFile | String | Pfad zur JSON-Datei des Google Cloud-Dienstkontoschlüssels. | Can be absolute or relative to the LibreChat root directory. |
Standard: api/data/auth.json (oder Umgebungsvariable GOOGLE_SERVICE_KEY_FILE)
Beispiel:
models
Das models-Feld definiert die verfügbaren Claude-Modelle und ordnet benutzerfreundliche Namen den Vertex AI-Deployment-IDs zu. Dies funktioniert ähnlich wie das Azure OpenAI-Modell-Mapping.
Formatoptionen
Sie können Modelle auf drei Arten konfigurieren:
Option 1: Einfaches Array
Verwenden Sie die tatsächlichen Vertex AI Modell-IDs direkt. Diese werden in der Benutzeroberfläche unverändert angezeigt:
Option 2: Objekt mit benutzerdefinierten Namen (Empfohlen)
Ordnen Sie benutzerfreundliche Namen den Vertex AI-Bereitstellungsnamen zu:
Option 3: Gemischtes Format mit Standardwert
Legen Sie einen Standard-Bereitstellungsnamen fest und verwenden Sie boolesche Werte für Modelle, die diesen übernehmen:
Model Object Properties
| Key | Type | Description | Example |
|---|---|---|---|
| deploymentName | String | Die tatsächliche Vertex AI Modell-ID, die für API-Aufrufe verwendet wird. | Required for each model unless using boolean `true` with a group-level default. |
Beispiel:
Alternative für Umgebungsvariablen
Für einfachere Setups können Sie Vertex AI mithilfe von Umgebungsvariablen anstelle von YAML konfigurieren:
Hinweis: Bei der Verwendung von Umgebungsvariablen ist das Model Mapping nicht verfügbar. Alle bekannten Claude-Modelle werden automatisch einbezogen.
Vollständige Beispiele
Grundlegende Einrichtung
Minimale Konfiguration unter Verwendung der Standardwerte (Vertex AI wird durch das Vorhandensein des vertex-Abschnitts aktiviert):
Dies verwendet:
- Region:
us-east5 - Service-Schlüssel:
api/data/auth.json(oderGOOGLE_SERVICE_KEY_FILEenv var) - Projekt-ID: Automatisch vom Dienstschlüssel erkannt
- Modelle: Alle bekannten Claude-Modelle
Produktions-Setup mit Model Mapping
Vollständige Konfiguration mit benutzerdefinierten Modellnamen und Titeln:
Multi-Region-Setup
Sie können nur eine Region pro Deployment konfigurieren. Für Anforderungen mit mehreren Regionen sollten Sie separate LibreChat-Instanzen oder benutzerdefinierte endpoints in Betracht ziehen.
Fehlerbehebung
Häufige Fehler
"Die Standard-Anmeldedaten konnten nicht geladen werden"
- Stellen Sie sicher, dass die Dienstkonto-Schlüsseldatei unter dem angegebenen Pfad vorhanden ist
- Überprüfen Sie die Dateiberechtigungen (müssen für den LibreChat-Prozess lesbar sein)
- Überprüfen Sie, ob die JSON-Datei gültig und nicht beschädigt ist
"Permission denied" oder "403 Forbidden"
- Stellen Sie sicher, dass das Dienstkonto über die Rolle
Vertex AI Userverfügt. - Stellen Sie sicher, dass Claude-Modelle in Ihrem Vertex AI Model Garden aktiviert sind.
- Überprüfen Sie, ob das Dienstkonto zum richtigen Projekt gehört
"Modell nicht gefunden"
- Überprüfen Sie, ob die Modell-ID in
deploymentNamekorrekt ist - Überprüfen Sie, ob das Modell in der von Ihnen ausgewählten Region verfügbar ist
- Stellen Sie sicher, dass das Modell in Ihrem Vertex AI Model Garden aktiviert ist.
Region-Probleme
"Invalid region" oder "Region not supported"
- Verwenden Sie eine der oben aufgeführten unterstützten Regionen
- Versuchen Sie es mit der Region
global, die ein automatisches Routing bietet. - Überprüfen Sie die Dokumentation von Google Cloud für die aktuelle Liste der Regionen, in denen Claude verfügbar ist.
"Modell in dieser Region nicht verfügbar"
- Nicht alle Claude-Modelle sind in allen Regionen verfügbar.
- Versuchen Sie, auf die Region
globalzu wechseln, um eine automatische Weiterleitung zu einer verfügbaren Region zu erhalten. - Überprüfen Sie den Vertex AI Model Garden, um zu sehen, welche Modelle in Ihrer Region verfügbar sind.
- Erwägen Sie die Verwendung einer anderen Region mit breiterer Modellverfügbarkeit (z. B.
us-east5)
Latenzprobleme
- Falls Sie eine hohe Latenz feststellen, versuchen Sie, eine Region zu verwenden, die geografisch näher an Ihren Benutzern liegt.
- Die
globalRegion leitet automatisch an die nächstgelegene verfügbare Region weiter - Für Produktions-Workloads mit strengen Latenzanforderungen sollten Sie verschiedene Regionen testen und diejenige auswählen, die für Ihren Anwendungsfall die beste Leistung bietet.
Einrichtung überprüfen
-
Stellen Sie sicher, dass Ihr Dienstkontoschlüssel gültig ist:
-
Testen Sie den Vertex AI-Zugriff:
-
Überprüfen Sie den Zugriff auf das Claude-Modell:
Hinweise
- Vertex AI und die direkte Anthropic API schließen sich gegenseitig aus. Wenn ein
vertexKonfigurationsabschnitt vorhanden ist, wird die UmgebungsvariableANTHROPIC_API_KEYignoriert. - Die Websuchfunktion wird mit Vertex AI vollständig unterstützt.
- Prompt Caching wird durch automatische Header-Filterung für die Kompatibilität mit Vertex AI unterstützt.
- Function calling und Tool-Nutzung funktionieren genauso wie bei der direkten Anthropic API.
Wie finden Sie diese Anleitung?