Anthropic Vertex AI Nesne Yapısı
LibreChat, Anthropic Claude modellerini Google Cloud Vertex AI aracılığıyla çalıştırmayı destekler. Bu, Claude modellerini mevcut Google Cloud altyapınız, faturalandırmanız ve kimlik bilgilerinizle kullanmanıza olanak tanır.
Ortam değişkenlerini kullanarak hızlı kurulum için Anthropic yapılandırma kılavuzuna bakın
Avantajlar
- Birleşik Faturalandırma: Mevcut Google Cloud faturalandırma hesabınızı kullanın
- Kurumsal Özellikler: Google Cloud'un kurumsal güvenlik ve uyumluluk özelliklerine erişin
- Bölgesel Uyumluluk: Veri yerleşimi gereksinimlerini karşılamak için belirli bölgelerde dağıtın
- Mevcut Altyapı: Mevcut GCP hizmet hesaplarınızdan ve IAM politikalarınızdan yararlanın
Ön Koşullar
Anthropic Vertex AI yapılandırmasından önce şunlara sahip olduğunuzdan emin olun:
- Vertex AI API'si etkinleştirilmiş Google Cloud Project
Vertex AI Userrolüne (roles/aiplatform.user) sahip Service Account- Vertex AI Model Garden üzerinde etkinleştirilmiş Claude models
- Service Account Key (JSON dosyası) indirilmiş ve LibreChat tarafından erişilebilir durumda
Örnek Yapılandırma
endpoints:
anthropic:
streamRate: 20
titleModel: "claude-3.5-haiku" # Use the visible model name (key from models config)
vertex:
region: "us-east5"
# serviceKeyFile: "/path/to/service-account.json" # Optional, defaults to api/data/auth.json
# projectId: "${VERTEX_PROJECT_ID}" # Optional, auto-detected from service key
# Model mapping: visible name -> Vertex AI deployment name
models:
claude-opus-4.5:
deploymentName: claude-opus-4-5@20251101
claude-sonnet-4:
deploymentName: claude-sonnet-4-20250514
claude-3.7-sonnet:
deploymentName: claude-3-7-sonnet-20250219
claude-3.5-sonnet:
deploymentName: claude-3-5-sonnet-v2@20241022
claude-3.5-haiku:
deploymentName: claude-3-5-haiku@20241022Not: Anthropic endpoint,
streamRate,titleModel,titleMethod,titlePrompt,titlePromptTemplatevetitleEndpointdahil olmak üzere tüm Shared Endpoint Settings ayarlarını destekler.
vertex
vertex nesnesi, tüm Vertex AI'a özgü yapılandırma seçeneklerini içerir.
region
Anahtar:
| Key | Type | Description | Example |
|---|---|---|---|
| region | String | Vertex AI endpoint'inizin dağıtıldığı Google Cloud bölgesi. | Must be a region where Claude models are available on Vertex AI. |
Varsayılan: us-east5
Kullanılabilir Bölgeler:
global(çoğu kullanım durumu için önerilir)us-east5us-central1europe-west1europe-west4asia-southeast1
İpucu: En yakın uygun bölgeye otomatik yönlendirme sağladığı için
globalbölgesi önerilir. Belirli bölgeleri yalnızca veri yerleşimi gereksinimleriniz varsa kullanın.
Örnek:
region: "global"projectId
Anahtar:
| Key | Type | Description | Example |
|---|---|---|---|
| projectId | String | Google Cloud Proje Kimliği. Ortam değişkeni referanslarını destekler. | Optional. If not specified, auto-detected from the service account key file. |
Varsayılan: Hizmet anahtarı dosyasından otomatik olarak algılanır
Örnek:
projectId: "${GOOGLE_PROJECT_ID}"serviceKeyFile
Anahtar:
| Key | Type | Description | Example |
|---|---|---|---|
| serviceKeyFile | String | Google Cloud hizmet hesabı anahtarı JSON dosyasının yolu. | Can be absolute or relative to the LibreChat root directory. |
Varsayılan: api/data/auth.json (veya GOOGLE_SERVICE_KEY_FILE ortam değişkeni)
Örnek:
serviceKeyFile: "/etc/secrets/gcp-service-account.json"models
models alanı, mevcut Claude modellerini tanımlar ve kullanıcı dostu isimleri Vertex AI dağıtım kimlikleriyle (deployment IDs) eşleştirir. Bu, Azure OpenAI model eşleme ile benzer şekilde çalışır.
Format Seçenekleri
Modelleri üç şekilde yapılandırabilirsiniz:
Seçenek 1: Basit Dizi
Doğrudan gerçek Vertex AI model kimliklerini (ID) kullanın. Bunlar arayüzde göründüğü gibi gösterilecektir:
models:
- "claude-sonnet-4-20250514"
- "claude-3-7-sonnet-20250219"
- "claude-3-5-haiku@20241022"Seçenek 2: Özel İsimlere Sahip Nesne (Önerilen)
Kullanıcı dostu adları Vertex AI dağıtım adlarıyla eşleştirin:
models:
claude-opus-4.5: # Visible in UI
deploymentName: claude-opus-4-5@20251101 # Actual Vertex AI model ID
claude-sonnet-4:
deploymentName: claude-sonnet-4-20250514
claude-3.5-haiku:
deploymentName: claude-3-5-haiku@20241022Seçenek 3: Varsayılan ile Karma Format
Varsayılan bir dağıtım adı ayarlayın ve bunu devralan modeller için boolean değerleri kullanın:
deploymentName: claude-sonnet-4-20250514 # Default deployment
models:
claude-sonnet-4: true # Uses default deploymentName
claude-3.5-haiku:
deploymentName: claude-3-5-haiku@20241022 # Override for this modelModel Nesnesi Özellikleri
| Key | Type | Description | Example |
|---|---|---|---|
| deploymentName | String | API çağrıları için kullanılan gerçek Vertex AI model kimliği. | Required for each model unless using boolean `true` with a group-level default. |
Örnek:
models:
claude-sonnet-4:
deploymentName: claude-sonnet-4-20250514Ortam Değişkeni Alternatifi
Daha basit kurulumlar için, Vertex AI'ı YAML yerine ortam değişkenlerini kullanarak yapılandırabilirsiniz:
# Enable Vertex AI mode
ANTHROPIC_USE_VERTEX=true
# Vertex AI region (optional, defaults to us-east5)
ANTHROPIC_VERTEX_REGION=global
# Path to service account key (optional, defaults to api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.jsonNot: Ortam değişkenlerini kullanırken, model eşleme (model mapping) özelliği kullanılamaz. Bilinen tüm Claude modelleri otomatik olarak dahil edilecektir.
Tam Örnekler
Temel Kurulum
Varsayılanları kullanan minimal yapılandırma (Vertex AI, vertex bölümünün varlığıyla etkinleştirilir):
endpoints:
anthropic:
vertex:
region: us-east5Bu şunları kullanır:
- Bölge:
us-east5 - Hizmet anahtarı:
api/data/auth.json(veyaGOOGLE_SERVICE_KEY_FILEenv var) - Proje Kimliği: Hizmet anahtarından otomatik olarak algılandı
- Modeller: Bilinen tüm Claude modelleri
Model Eşleştirme ile Üretim Kurulumu
Özel model adları ve başlıkları ile tam yapılandırma:
endpoints:
anthropic:
streamRate: 20
titleModel: "haiku"
titleMethod: "completion"
vertex:
region: "global"
serviceKeyFile: "${GOOGLE_SERVICE_KEY_FILE}"
models:
opus:
deploymentName: claude-opus-4-5@20251101
sonnet:
deploymentName: claude-sonnet-4-20250514
haiku:
deploymentName: claude-3-5-haiku@20241022Çoklu Bölge Kurulumu
Her dağıtım için yalnızca bir bölge yapılandırabilirsiniz. Çoklu bölge ihtiyaçları için ayrı LibreChat örnekleri veya özel endpoint'ler kullanmayı düşünün.
Sorun Giderme
Yaygın Hatalar
"Varsayılan kimlik bilgileri yüklenemedi"
- Hizmet hesabı anahtar dosyasının belirtilen yolda bulunduğundan emin olun
- Dosya izinlerini kontrol edin (LibreChat süreci tarafından okunabilir olmalıdır)
- JSON dosyasının geçerli olduğunu ve bozulmadığını doğrulayın
"Permission denied" veya "403 Forbidden"
- Hizmet hesabının
Vertex AI Userrolüne sahip olduğunu doğrulayın - Claude modellerinin Vertex AI Model Garden'ınızda etkinleştirildiğinden emin olun
- Hizmet hesabının doğru projeye ait olduğunu kontrol edin
"Model bulunamadı"
deploymentNameiçindeki model kimliğinin (model ID) doğru olduğunu kontrol edin- Modelin seçtiğiniz bölgede kullanılabilir olduğunu doğrulayın
- Modelin Vertex AI Model Garden üzerinde etkinleştirildiğinden emin olun
Bölge Sorunları
"Invalid region" veya "Region not supported"
- Yukarıda listelenen desteklenen bölgelerden birini kullanın
- Otomatik yönlendirme sağlayan
globalbölgesini kullanmayı deneyin - Claude'un kullanılabildiği bölgelerin güncel listesi için Google Cloud'un belgelerine göz atın
"Model bölgenizde kullanılamıyor"
- Tüm Claude modelleri tüm bölgelerde kullanılamaz
- Kullanılabilir bir bölgeye otomatik yönlendirme için
globalbölgesine geçmeyi deneyin - Bölgenizde hangi modellerin mevcut olduğunu görmek için Vertex AI Model Garden sayfasını kontrol edin.
- Daha geniş model kullanılabilirliğine sahip farklı bir bölge kullanmayı düşünün (örneğin,
us-east5)
Gecikme sorunları
- Yüksek gecikme süresi yaşıyorsanız, kullanıcılarınıza coğrafi olarak daha yakın bir bölge kullanmayı deneyin
globalbölgesi otomatik olarak en yakın kullanılabilir bölgeye yönlendirme yapar- Sıkı gecikme gereksinimleri olan üretim iş yükleri için farklı bölgeleri test edin ve kullanım durumunuz için en iyi performansı sunanı seçin.
Kurulumu Doğrulama
-
Hizmet hesabı anahtarınızın geçerli olduğundan emin olun:
gcloud auth activate-service-account --key-file=/path/to/key.json gcloud auth list -
Vertex AI erişimini test edin:
gcloud ai models list --region=us-east5 -
Claude model erişimini doğrulayın:
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://us-east5-aiplatform.googleapis.com/v1/projects/YOUR_PROJECT/locations/us-east5/publishers/anthropic/models/claude-3-5-haiku@20241022:rawPredict" \ -d '{"anthropic_version": "vertex-2023-10-16", "max_tokens": 100, "messages": [{"role": "user", "content": "Hello"}]}'
Notlar
- Vertex AI ve doğrudan Anthropic API birbirini dışlar. Bir
vertexyapılandırma bölümü mevcut olduğunda,ANTHROPIC_API_KEYortam değişkeni yok sayılır. - Web arama işlevi Vertex AI ile tam olarak desteklenmektedir.
- Vertex AI uyumluluğu için otomatik başlık filtreleme aracılığıyla Prompt caching desteklenmektedir.
- Function calling ve tool use, doğrudan Anthropic API ile aynı şekilde çalışır.
Bu rehber nasıl?