Spraakconfiguratie
Overzicht
Het speech object stelt je in staat om Text-to-Speech (TTS) en Speech-to-Text (STT) providers direct te configureren in je librechat.yaml configuratiebestand. Dit maakt server-side spraakservices mogelijk zonder dat gebruikers hun eigen API-sleutels hoeven te configureren.
Velden onder speech:
tts- Configuratie van Text-to-Speech providersstt- Configuratie van Speech-to-Text providersspeechTab- Standaard UI-instellingen voor spraakfuncties
Opmerkingen:
- Meerdere providers kunnen tegelijkertijd worden geconfigureerd
- Gebruikers kunnen hun voorkeursaanbieder selecteren uit de beschikbare opties
- API-sleutels in het configuratiebestand moeten om veiligheidsredenen verwijzingen naar omgevingsvariabelen gebruiken
Voorbeeld
speech:
tts:
openai:
apiKey: "${TTS_API_KEY}"
model: "tts-1"
voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
elevenlabs:
apiKey: "${ELEVENLABS_API_KEY}"
model: "eleven_multilingual_v2"
voices: ["voice-id-1", "voice-id-2"]
stt:
openai:
apiKey: "${STT_API_KEY}"
model: "whisper-1"
speechTab:
conversationMode: true
advancedMode: false
speechToText: true
textToSpeech: truetts
Het tts object configureert Text-to-Speech providers. Er kunnen meerdere providers worden geconfigureerd en gebruikers kunnen kiezen welke ze willen gebruiken.
openai
OpenAI TTS-configuratie met modellen zoals tts-1 of tts-1-hd.
| Key | Type | Description | Example |
|---|---|---|---|
| url | String | Aangepaste API-URL (optioneel). Gebruik voor OpenAI-compatibele endpoints. | |
| apiKey | String | OpenAI API-sleutel. Gebruik een omgevingsvariabele-referentie. | Required |
| model | String | Te gebruiken TTS-model (bijv. "tts-1", "tts-1-hd"). | Required |
| voices | Array of Strings | Beschikbare stemopties die gebruikers kunnen selecteren. | Required |
Voorbeeld:
tts:
openai:
apiKey: "${TTS_API_KEY}"
model: "tts-1"
voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]azureOpenAI
Azure OpenAI TTS configuratie.
| Key | Type | Description | Example |
|---|---|---|---|
| instanceName | String | Azure OpenAI exemplaarnaam. | Required |
| apiKey | String | Azure OpenAI API-sleutel. | Required |
| deploymentName | String | De deployment-naam voor het TTS-model. | Required |
| apiVersion | String | Azure OpenAI API-versie. | Required |
| model | String | TTS-model-identificatie. | Required |
| voices | Array of Strings | Beschikbare stemopties. | Required |
Voorbeeld:
tts:
azureOpenAI:
instanceName: "my-azure-instance"
apiKey: "${AZURE_TTS_API_KEY}"
deploymentName: "tts-deployment"
apiVersion: "2024-02-15-preview"
model: "tts-1"
voices: ["alloy", "echo", "nova"]elevenlabs
ElevenLabs TTS-configuratie voor hoogwaardige spraaksynthese.
| Key | Type | Description | Example |
|---|---|---|---|
| url | String | Aangepaste API-URL (optioneel). | |
| websocketUrl | String | WebSocket URL voor streaming (optioneel). | |
| apiKey | String | ElevenLabs API-sleutel. | Required |
| model | String | ElevenLabs model (bijv. "eleven_multilingual_v2"). | Required |
| voices | Array of Strings | Voice-ID's beschikbaar voor selectie. | Required |
| voice_settings | Object | Instellingen voor spraakaanpassing (optioneel). | |
| pronunciation_dictionary_locators | Array of Strings | Uitspraakwoordenboek-ID's (optioneel). |
voice_settings sub-keys:
| Key | Type | Description | Example |
|---|---|---|---|
| similarity_boost | Number | Verbetering van stemgelijkenis (0-1). | |
| stability | Number | Spraakstabiliteit (0-1). | |
| style | Number | Stijl-overdrijving (0-1). | |
| use_speaker_boost | Boolean | Schakel speaker boost in. |
Voorbeeld:
tts:
elevenlabs:
apiKey: "${ELEVENLABS_API_KEY}"
model: "eleven_multilingual_v2"
voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
voice_settings:
stability: 0.5
similarity_boost: 0.75
use_speaker_boost: truelocalai
LocalAI TTS-configuratie voor self-hosted spraaksynthese.
| Key | Type | Description | Example |
|---|---|---|---|
| url | String | URL van de LocalAI-server. | Required |
| apiKey | String | API-sleutel indien authenticatie is ingeschakeld (optioneel). | |
| voices | Array of Strings | Beschikbare stemmodellen. | Required |
| backend | String | Te gebruiken TTS-backend (bijv. "piper"). | Required |
Voorbeeld:
tts:
localai:
url: "http://localhost:8080"
voices: ["en-us-amy-low", "en-us-danny-low"]
backend: "piper"stt
Het stt object configureert Speech-to-Text providers.
openai
OpenAI Whisper STT configuratie.
| Key | Type | Description | Example |
|---|---|---|---|
| url | String | Aangepaste API-URL (optioneel). Gebruik voor OpenAI-compatibele endpoints. | |
| apiKey | String | OpenAI API-sleutel. Gebruik een omgevingsvariabele-referentie. | Required |
| model | String | Te gebruiken STT-model (bijv. "whisper-1"). | Required |
Voorbeeld:
stt:
openai:
apiKey: "${STT_API_KEY}"
model: "whisper-1"azureOpenAI
Azure OpenAI Whisper STT configuratie.
| Key | Type | Description | Example |
|---|---|---|---|
| instanceName | String | Azure OpenAI exemplaarnaam. | Required |
| apiKey | String | Azure OpenAI API-sleutel. | Required |
| deploymentName | String | De deployment-naam voor het Whisper-model. | Required |
| apiVersion | String | Azure OpenAI API-versie. | Required |
Voorbeeld:
stt:
azureOpenAI:
instanceName: "my-azure-instance"
apiKey: "${AZURE_STT_API_KEY}"
deploymentName: "whisper-deployment"
apiVersion: "2024-02-15-preview"speechTab
Het speechTab object configureert standaard UI-instellingen voor spraakfuncties. Deze instellingen bepalen wat gebruikers standaard zien in het paneel met spraakinstellingen.
| Key | Type | Description | Example |
|---|---|---|---|
| conversationMode | Boolean | Schakel gespreksmodus standaard in. | false |
| advancedMode | Boolean | Toon standaard geavanceerde spraakinstellingen. | false |
| speechToText | Boolean or Object | Schakel STT standaard in, of configureer gedetailleerde STT-instellingen. | false |
| textToSpeech | Boolean or Object | Schakel TTS standaard in, of configureer gedetailleerde TTS-instellingen. | false |
speechToText (Object-indeling)
Bij gebruik van een object in plaats van een boolean:
| Key | Type | Description | Example |
|---|---|---|---|
| engineSTT | String | Standaard STT-engine. Opties: `"openai"`, `"azureOpenAI"`. | |
| languageSTT | String | Standaardtaal voor STT. | |
| autoTranscribeAudio | Boolean | Transcribeer audioberichten automatisch. | |
| decibelValue | Number | Decibeldrempel voor stemdetectie. | |
| autoSendText | Number | Vertraging in ms voordat getranscribeerde tekst automatisch wordt verzonden (0 om uit te schakelen). |
textToSpeech (Object-indeling)
Bij gebruik van een object in plaats van een boolean:
| Key | Type | Description | Example |
|---|---|---|---|
| engineTTS | String | Standaard TTS-engine. Opties: `"openai"`, `"azureOpenAI"`, `"elevenlabs"`, `"localai"`. | |
| voice | String | Standaard stemselectie. | |
| languageTTS | String | Standaardtaal voor TTS. | |
| automaticPlayback | Boolean | Speel TTS-reacties automatisch af. | |
| playbackRate | Number | Standaard afspeelsnelheid (1.0 = normaal). Bereik: 0.25–4.0. | |
| cacheTTS | Boolean | Cache TTS-audio voor herhaald afspelen. |
Voorbeeld:
speechTab:
conversationMode: false
advancedMode: false
speechToText:
engineSTT: "openai"
autoTranscribeAudio: true
decibelValue: -45
textToSpeech:
engineTTS: "openai"
voice: "nova"
automaticPlayback: false
playbackRate: 1.0
cacheTTS: trueVolledig voorbeeld
version: 1.3.10
cache: true
speech:
tts:
openai:
apiKey: "${TTS_API_KEY}"
model: "tts-1-hd"
voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
elevenlabs:
apiKey: "${ELEVENLABS_API_KEY}"
model: "eleven_multilingual_v2"
voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
voice_settings:
stability: 0.5
similarity_boost: 0.75
stt:
openai:
apiKey: "${STT_API_KEY}"
model: "whisper-1"
speechTab:
conversationMode: false
advancedMode: false
speechToText: true
textToSpeech:
engineTTS: "openai"
voice: "nova"
automaticPlayback: falseOpmerkingen
- Gebruik altijd omgevingsvariabele-verwijzingen (bijv.
${API_KEY}) voor API-sleutels in configuratiebestanden - Meerdere TTS-providers kunnen worden geconfigureerd; gebruikers selecteren hun voorkeursoptie in de UI
- De
speechTabinstellingen definiëren standaardwaarden die gebruikers kunnen overschrijven in hun persoonlijke instellingen - Voor gedetailleerde functiedocumentatie, zie Speech to Text & Text to Speech
Hoe is deze gids?