Spraakconfiguratie

Overzicht

Het speech object stelt je in staat om Text-to-Speech (TTS) en Speech-to-Text (STT) providers direct te configureren in je librechat.yaml configuratiebestand. Dit maakt server-side spraakservices mogelijk zonder dat gebruikers hun eigen API-sleutels hoeven te configureren.

Velden onder speech:

tts - Configuratie van Text-to-Speech providers
stt - Configuratie van Speech-to-Text providers
speechTab - Standaard UI-instellingen voor spraakfuncties

Opmerkingen:

Meerdere providers kunnen tegelijkertijd worden geconfigureerd
Gebruikers kunnen hun voorkeursaanbieder selecteren uit de beschikbare opties
API-sleutels in het configuratiebestand moeten om veiligheidsredenen verwijzingen naar omgevingsvariabelen gebruiken

Voorbeeld

speech:
  tts:
    openai:
      apiKey: "${TTS_API_KEY}"
      model: "tts-1"
      voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
    elevenlabs:
      apiKey: "${ELEVENLABS_API_KEY}"
      model: "eleven_multilingual_v2"
      voices: ["voice-id-1", "voice-id-2"]
  stt:
    openai:
      apiKey: "${STT_API_KEY}"
      model: "whisper-1"
  speechTab:
    conversationMode: true
    advancedMode: false
    speechToText: true
    textToSpeech: true

tts

Het tts object configureert Text-to-Speech providers. Er kunnen meerdere providers worden geconfigureerd en gebruikers kunnen kiezen welke ze willen gebruiken.

openai

OpenAI TTS-configuratie met modellen zoals tts-1 of tts-1-hd.

Key	Type	Description	Example
url	String	Aangepaste API-URL (optioneel). Gebruik voor OpenAI-compatibele endpoints.
apiKey	String	OpenAI API-sleutel. Gebruik een omgevingsvariabele-referentie.	Required
model	String	Te gebruiken TTS-model (bijv. "tts-1", "tts-1-hd").	Required
voices	Array of Strings	Beschikbare stemopties die gebruikers kunnen selecteren.	Required

Voorbeeld:

tts:
  openai:
    apiKey: "${TTS_API_KEY}"
    model: "tts-1"
    voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]

azureOpenAI

Azure OpenAI TTS configuratie.

Key	Type	Description	Example
instanceName	String	Azure OpenAI exemplaarnaam.	Required
apiKey	String	Azure OpenAI API-sleutel.	Required
deploymentName	String	De deployment-naam voor het TTS-model.	Required
apiVersion	String	Azure OpenAI API-versie.	Required
model	String	TTS-model-identificatie.	Required
voices	Array of Strings	Beschikbare stemopties.	Required

Voorbeeld:

tts:
  azureOpenAI:
    instanceName: "my-azure-instance"
    apiKey: "${AZURE_TTS_API_KEY}"
    deploymentName: "tts-deployment"
    apiVersion: "2024-02-15-preview"
    model: "tts-1"
    voices: ["alloy", "echo", "nova"]

elevenlabs

ElevenLabs TTS-configuratie voor hoogwaardige spraaksynthese.

Key	Type	Description	Example
url	String	Aangepaste API-URL (optioneel).
websocketUrl	String	WebSocket URL voor streaming (optioneel).
apiKey	String	ElevenLabs API-sleutel.	Required
model	String	ElevenLabs model (bijv. "eleven_multilingual_v2").	Required
voices	Array of Strings	Voice-ID's beschikbaar voor selectie.	Required
voice_settings	Object	Instellingen voor spraakaanpassing (optioneel).
pronunciation_dictionary_locators	Array of Strings	Uitspraakwoordenboek-ID's (optioneel).

voice_settings sub-keys:

Key	Type	Description
similarity_boost	Number	Verbetering van stemgelijkenis (0-1).
stability	Number	Spraakstabiliteit (0-1).
style	Number	Stijl-overdrijving (0-1).
use_speaker_boost	Boolean	Schakel speaker boost in.

Voorbeeld:

tts:
  elevenlabs:
    apiKey: "${ELEVENLABS_API_KEY}"
    model: "eleven_multilingual_v2"
    voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
    voice_settings:
      stability: 0.5
      similarity_boost: 0.75
      use_speaker_boost: true

localai

LocalAI TTS-configuratie voor self-hosted spraaksynthese.

Key	Type	Description	Example
url	String	URL van de LocalAI-server.	Required
apiKey	String	API-sleutel indien authenticatie is ingeschakeld (optioneel).
voices	Array of Strings	Beschikbare stemmodellen.	Required
backend	String	Te gebruiken TTS-backend (bijv. "piper").	Required

Voorbeeld:

tts:
  localai:
    url: "http://localhost:8080"
    voices: ["en-us-amy-low", "en-us-danny-low"]
    backend: "piper"

stt

Het stt object configureert Speech-to-Text providers.

openai

OpenAI Whisper STT configuratie.

Key	Type	Description	Example
url	String	Aangepaste API-URL (optioneel). Gebruik voor OpenAI-compatibele endpoints.
apiKey	String	OpenAI API-sleutel. Gebruik een omgevingsvariabele-referentie.	Required
model	String	Te gebruiken STT-model (bijv. "whisper-1").	Required

Voorbeeld:

stt:
  openai:
    apiKey: "${STT_API_KEY}"
    model: "whisper-1"

azureOpenAI

Azure OpenAI Whisper STT configuratie.

Key	Type	Description	Example
instanceName	String	Azure OpenAI exemplaarnaam.	Required
apiKey	String	Azure OpenAI API-sleutel.	Required
deploymentName	String	De deployment-naam voor het Whisper-model.	Required
apiVersion	String	Azure OpenAI API-versie.	Required

Voorbeeld:

stt:
  azureOpenAI:
    instanceName: "my-azure-instance"
    apiKey: "${AZURE_STT_API_KEY}"
    deploymentName: "whisper-deployment"
    apiVersion: "2024-02-15-preview"

speechTab

Het speechTab object configureert standaard UI-instellingen voor spraakfuncties. Deze instellingen bepalen wat gebruikers standaard zien in het paneel met spraakinstellingen.

Key	Type	Description	Example
conversationMode	Boolean	Schakel gespreksmodus standaard in.	false
advancedMode	Boolean	Toon standaard geavanceerde spraakinstellingen.	false
speechToText	Boolean or Object	Schakel STT standaard in, of configureer gedetailleerde STT-instellingen.	false
textToSpeech	Boolean or Object	Schakel TTS standaard in, of configureer gedetailleerde TTS-instellingen.	false

speechToText (Object-indeling)

Bij gebruik van een object in plaats van een boolean:

Key	Type	Description
engineSTT	String	Standaard STT-engine. Opties: `"openai"`, `"azureOpenAI"`.
languageSTT	String	Standaardtaal voor STT.
autoTranscribeAudio	Boolean	Transcribeer audioberichten automatisch.
decibelValue	Number	Decibeldrempel voor stemdetectie.
autoSendText	Number	Vertraging in ms voordat getranscribeerde tekst automatisch wordt verzonden (0 om uit te schakelen).

textToSpeech (Object-indeling)

Bij gebruik van een object in plaats van een boolean:

Key	Type	Description
engineTTS	String	Standaard TTS-engine. Opties: `"openai"`, `"azureOpenAI"`, `"elevenlabs"`, `"localai"`.
voice	String	Standaard stemselectie.
languageTTS	String	Standaardtaal voor TTS.
automaticPlayback	Boolean	Speel TTS-reacties automatisch af.
playbackRate	Number	Standaard afspeelsnelheid (1.0 = normaal). Bereik: 0.25–4.0.
cacheTTS	Boolean	Cache TTS-audio voor herhaald afspelen.

Voorbeeld:

speechTab:
  conversationMode: false
  advancedMode: false
  speechToText:
    engineSTT: "openai"
    autoTranscribeAudio: true
    decibelValue: -45
  textToSpeech:
    engineTTS: "openai"
    voice: "nova"
    automaticPlayback: false
    playbackRate: 1.0
    cacheTTS: true

Volledig voorbeeld

version: 1.3.10
cache: true

speech:
  tts:
    openai:
      apiKey: "${TTS_API_KEY}"
      model: "tts-1-hd"
      voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
    elevenlabs:
      apiKey: "${ELEVENLABS_API_KEY}"
      model: "eleven_multilingual_v2"
      voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
      voice_settings:
        stability: 0.5
        similarity_boost: 0.75
  stt:
    openai:
      apiKey: "${STT_API_KEY}"
      model: "whisper-1"
  speechTab:
    conversationMode: false
    advancedMode: false
    speechToText: true
    textToSpeech:
      engineTTS: "openai"
      voice: "nova"
      automaticPlayback: false

Opmerkingen

Gebruik altijd omgevingsvariabele-verwijzingen (bijv. ${API_KEY}) voor API-sleutels in configuratiebestanden
Meerdere TTS-providers kunnen worden geconfigureerd; gebruikers selecteren hun voorkeursoptie in de UI
De speechTab instellingen definiëren standaardwaarden die gebruikers kunnen overschrijven in hun persoonlijke instellingen
Voor gedetailleerde functiedocumentatie, zie Speech to Text & Text to Speech

Spraakconfiguratie

Op deze pagina