Konuşma Yapılandırması
Genel Bakış
speech nesnesi, Metinden Konuşmaya (TTS) ve Konuştan Metne (STT) sağlayıcılarını doğrudan librechat.yaml yapılandırma dosyanızda yapılandırmanıza olanak tanır. Bu, kullanıcıların kendi API anahtarlarını yapılandırmasına gerek kalmadan sunucu tarafında konuşma hizmetlerini etkinleştirir.
speech altındaki alanlar:
tts- Metinden Konuşmaya (Text-to-Speech) sağlayıcı yapılandırmalarıstt- Speech-to-Text sağlayıcı yapılandırmalarıspeechTab- Konuşma özellikleri için varsayılan arayüz ayarları
Notlar:
- Birden fazla sağlayıcı aynı anda yapılandırılabilir
- Kullanıcılar, mevcut seçenekler arasından tercih ettikleri sağlayıcıyı seçebilirler.
- Yapılandırma dosyasındaki API anahtarları, güvenlik nedeniyle ortam değişkeni referanslarını kullanmalıdır
Örnek
speech:
tts:
openai:
apiKey: "${TTS_API_KEY}"
model: "tts-1"
voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
elevenlabs:
apiKey: "${ELEVENLABS_API_KEY}"
model: "eleven_multilingual_v2"
voices: ["voice-id-1", "voice-id-2"]
stt:
openai:
apiKey: "${STT_API_KEY}"
model: "whisper-1"
speechTab:
conversationMode: true
advancedMode: false
speechToText: true
textToSpeech: truetts
tts nesnesi, Metin Okuma (Text-to-Speech) sağlayıcılarını yapılandırır. Birden fazla sağlayıcı yapılandırılabilir ve kullanıcılar hangisini kullanacaklarını seçebilirler.
openai
tts-1 veya tts-1-hd gibi modelleri kullanarak OpenAI TTS yapılandırması.
| Key | Type | Description | Example |
|---|---|---|---|
| url | String | Özel API URL'si (isteğe bağlı). OpenAI uyumlu endpoint'ler için kullanın. | |
| apiKey | String | OpenAI API anahtarı. Ortam değişkeni referansını kullanın. | Required |
| model | String | Kullanılacak TTS modeli (örneğin, "tts-1", "tts-1-hd"). | Required |
| voices | Array of Strings | Kullanıcıların seçebileceği mevcut ses seçenekleri. | Required |
Örnek:
tts:
openai:
apiKey: "${TTS_API_KEY}"
model: "tts-1"
voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]azureOpenAI
Azure OpenAI TTS yapılandırması.
| Key | Type | Description | Example |
|---|---|---|---|
| instanceName | String | Azure OpenAI örnek adı. | Required |
| apiKey | String | Azure OpenAI API anahtarı. | Required |
| deploymentName | String | TTS modeli için deployment adı. | Required |
| apiVersion | String | Azure OpenAI API sürümü. | Required |
| model | String | TTS model tanımlayıcısı. | Required |
| voices | Array of Strings | Kullanılabilir ses seçenekleri. | Required |
Örnek:
tts:
azureOpenAI:
instanceName: "my-azure-instance"
apiKey: "${AZURE_TTS_API_KEY}"
deploymentName: "tts-deployment"
apiVersion: "2024-02-15-preview"
model: "tts-1"
voices: ["alloy", "echo", "nova"]elevenlabs
Yüksek kaliteli ses sentezi için ElevenLabs TTS yapılandırması.
| Key | Type | Description | Example |
|---|---|---|---|
| url | String | Özel API URL'si (isteğe bağlı). | |
| websocketUrl | String | Akış için WebSocket URL'si (isteğe bağlı). | |
| apiKey | String | ElevenLabs API anahtarı. | Required |
| model | String | ElevenLabs modeli (örneğin, "eleven_multilingual_v2"). | Required |
| voices | Array of Strings | Seçim için kullanılabilir Ses Kimlikleri (Voice IDs). | Required |
| voice_settings | Object | Ses özelleştirme ayarları (isteğe bağlı). | |
| pronunciation_dictionary_locators | Array of Strings | Telaffuz sözlüğü kimlikleri (isteğe bağlı). |
voice_settings Alt anahtarları:
| Key | Type | Description | Example |
|---|---|---|---|
| similarity_boost | Number | Ses benzerliği iyileştirmesi (0-1). | |
| stability | Number | Ses kararlılığı (0-1). | |
| style | Number | Stil abartısı (0-1). | |
| use_speaker_boost | Boolean | Hoparlör güçlendirmeyi etkinleştir. |
Örnek:
tts:
elevenlabs:
apiKey: "${ELEVENLABS_API_KEY}"
model: "eleven_multilingual_v2"
voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
voice_settings:
stability: 0.5
similarity_boost: 0.75
use_speaker_boost: truelocalai
Kendi kendine barındırılan konuşma sentezi için LocalAI TTS yapılandırması.
| Key | Type | Description | Example |
|---|---|---|---|
| url | String | LocalAI sunucu URL'si. | Required |
| apiKey | String | Kimlik doğrulama etkinse API anahtarı (isteğe bağlı). | |
| voices | Array of Strings | Kullanılabilir ses modelleri. | Required |
| backend | String | Kullanılacak TTS arka ucu (örneğin, "piper"). | Required |
Örnek:
tts:
localai:
url: "http://localhost:8080"
voices: ["en-us-amy-low", "en-us-danny-low"]
backend: "piper"stt
stt nesnesi, Speech-to-Text sağlayıcılarını yapılandırır.
openai
OpenAI Whisper STT yapılandırması.
| Key | Type | Description | Example |
|---|---|---|---|
| url | String | Özel API URL'si (isteğe bağlı). OpenAI uyumlu endpoint'ler için kullanın. | |
| apiKey | String | OpenAI API anahtarı. Ortam değişkeni referansını kullanın. | Required |
| model | String | Kullanılacak STT modeli (örneğin, "whisper-1"). | Required |
Örnek:
stt:
openai:
apiKey: "${STT_API_KEY}"
model: "whisper-1"azureOpenAI
Azure OpenAI Whisper STT yapılandırması.
| Key | Type | Description | Example |
|---|---|---|---|
| instanceName | String | Azure OpenAI örnek adı. | Required |
| apiKey | String | Azure OpenAI API anahtarı. | Required |
| deploymentName | String | Whisper modeli için deployment adı. | Required |
| apiVersion | String | Azure OpenAI API sürümü. | Required |
Örnek:
stt:
azureOpenAI:
instanceName: "my-azure-instance"
apiKey: "${AZURE_STT_API_KEY}"
deploymentName: "whisper-deployment"
apiVersion: "2024-02-15-preview"speechTab
speechTab nesnesi, konuşma özellikleri için varsayılan arayüz ayarlarını yapılandırır. Bu ayarlar, kullanıcıların konuşma ayarları panelinde varsayılan olarak ne göreceğini kontrol eder.
| Key | Type | Description | Example |
|---|---|---|---|
| conversationMode | Boolean | Sohbet modunu varsayılan olarak etkinleştir. | false |
| advancedMode | Boolean | Gelişmiş konuşma ayarlarını varsayılan olarak göster. | false |
| speechToText | Boolean or Object | STT'yi varsayılan olarak etkinleştirin veya ayrıntılı STT ayarlarını yapılandırın. | false |
| textToSpeech | Boolean or Object | TTS'yi varsayılan olarak etkinleştirin veya ayrıntılı TTS ayarlarını yapılandırın. | false |
speechToText (Nesne formatı)
Boolean yerine bir nesne kullanırken:
| Key | Type | Description | Example |
|---|---|---|---|
| engineSTT | String | Varsayılan STT motoru. Seçenekler: `"openai"`, `"azureOpenAI"`. | |
| languageSTT | String | STT için varsayılan dil. | |
| autoTranscribeAudio | Boolean | Sesli mesajları otomatik olarak yazıya dökün. | |
| decibelValue | Number | Ses algılama için desibel eşiği. | |
| autoSendText | Number | Transkribe edilen metnin otomatik gönderilmesinden önceki ms cinsinden gecikme (devre dışı bırakmak için 0). |
textToSpeech (Nesne formatı)
Boolean yerine bir nesne kullanırken:
| Key | Type | Description | Example |
|---|---|---|---|
| engineTTS | String | Varsayılan TTS motoru. Seçenekler: `"openai"`, `"azureOpenAI"`, `"elevenlabs"`, `"localai"`. | |
| voice | String | Varsayılan ses seçimi. | |
| languageTTS | String | TTS için varsayılan dil. | |
| automaticPlayback | Boolean | TTS yanıtlarını otomatik olarak oynat. | |
| playbackRate | Number | Varsayılan oynatma hızı (1.0 = normal). Aralık: 0.25–4.0. | |
| cacheTTS | Boolean | Tekrarlanan oynatmalar için TTS sesini önbelleğe al. |
Örnek:
speechTab:
conversationMode: false
advancedMode: false
speechToText:
engineSTT: "openai"
autoTranscribeAudio: true
decibelValue: -45
textToSpeech:
engineTTS: "openai"
voice: "nova"
automaticPlayback: false
playbackRate: 1.0
cacheTTS: trueTam Örnek
version: 1.3.10
cache: true
speech:
tts:
openai:
apiKey: "${TTS_API_KEY}"
model: "tts-1-hd"
voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
elevenlabs:
apiKey: "${ELEVENLABS_API_KEY}"
model: "eleven_multilingual_v2"
voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
voice_settings:
stability: 0.5
similarity_boost: 0.75
stt:
openai:
apiKey: "${STT_API_KEY}"
model: "whisper-1"
speechTab:
conversationMode: false
advancedMode: false
speechToText: true
textToSpeech:
engineTTS: "openai"
voice: "nova"
automaticPlayback: falseNotlar
- Yapılandırma dosyalarındaki API anahtarları için her zaman ortam değişkeni referanslarını (örneğin,
${API_KEY}) kullanın - Birden fazla TTS sağlayıcısı yapılandırılabilir; kullanıcılar tercih ettikleri seçeneği arayüz üzerinden seçerler.
speechTabayarları, kullanıcıların kişisel ayarlarından geçersiz kılabileceği varsayılan değerleri tanımlar- Ayrıntılı özellik belgeleri için Speech to Text & Text to Speech bölümüne bakın.
Bu rehber nasıl?