Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack 🎉 Learn more
LibreChat

Spraakconfiguratie

Overzicht

Het speech object stelt je in staat om Text-to-Speech (TTS) en Speech-to-Text (STT) providers direct te configureren in je librechat.yaml configuratiebestand. Dit maakt server-side spraakservices mogelijk zonder dat gebruikers hun eigen API-sleutels hoeven te configureren.

Velden onder speech:

  • tts - Configuratie van Text-to-Speech providers
  • stt - Configuratie van Speech-to-Text providers
  • speechTab - Standaard UI-instellingen voor spraakfuncties

Opmerkingen:

  • Meerdere providers kunnen tegelijkertijd worden geconfigureerd
  • Gebruikers kunnen hun voorkeursaanbieder selecteren uit de beschikbare opties
  • API-sleutels in het configuratiebestand moeten om veiligheidsredenen verwijzingen naar omgevingsvariabelen gebruiken

Voorbeeld

speech:
  tts:
    openai:
      apiKey: "${TTS_API_KEY}"
      model: "tts-1"
      voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
    elevenlabs:
      apiKey: "${ELEVENLABS_API_KEY}"
      model: "eleven_multilingual_v2"
      voices: ["voice-id-1", "voice-id-2"]
  stt:
    openai:
      apiKey: "${STT_API_KEY}"
      model: "whisper-1"
  speechTab:
    conversationMode: true
    advancedMode: false
    speechToText: true
    textToSpeech: true

tts

Het tts object configureert Text-to-Speech providers. Er kunnen meerdere providers worden geconfigureerd en gebruikers kunnen kiezen welke ze willen gebruiken.

openai

OpenAI TTS-configuratie met modellen zoals tts-1 of tts-1-hd.

KeyTypeDescriptionExample
urlStringAangepaste API-URL (optioneel). Gebruik voor OpenAI-compatibele endpoints.
apiKeyStringOpenAI API-sleutel. Gebruik een omgevingsvariabele-referentie.Required
modelStringTe gebruiken TTS-model (bijv. "tts-1", "tts-1-hd").Required
voicesArray of StringsBeschikbare stemopties die gebruikers kunnen selecteren.Required

Voorbeeld:

tts:
  openai:
    apiKey: "${TTS_API_KEY}"
    model: "tts-1"
    voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]

azureOpenAI

Azure OpenAI TTS configuratie.

KeyTypeDescriptionExample
instanceNameStringAzure OpenAI exemplaarnaam.Required
apiKeyStringAzure OpenAI API-sleutel.Required
deploymentNameStringDe deployment-naam voor het TTS-model.Required
apiVersionStringAzure OpenAI API-versie.Required
modelStringTTS-model-identificatie.Required
voicesArray of StringsBeschikbare stemopties.Required

Voorbeeld:

tts:
  azureOpenAI:
    instanceName: "my-azure-instance"
    apiKey: "${AZURE_TTS_API_KEY}"
    deploymentName: "tts-deployment"
    apiVersion: "2024-02-15-preview"
    model: "tts-1"
    voices: ["alloy", "echo", "nova"]

elevenlabs

ElevenLabs TTS-configuratie voor hoogwaardige spraaksynthese.

KeyTypeDescriptionExample
urlStringAangepaste API-URL (optioneel).
websocketUrlStringWebSocket URL voor streaming (optioneel).
apiKeyStringElevenLabs API-sleutel.Required
modelStringElevenLabs model (bijv. "eleven_multilingual_v2").Required
voicesArray of StringsVoice-ID's beschikbaar voor selectie.Required
voice_settingsObjectInstellingen voor spraakaanpassing (optioneel).
pronunciation_dictionary_locatorsArray of StringsUitspraakwoordenboek-ID's (optioneel).

voice_settings sub-keys:

KeyTypeDescriptionExample
similarity_boostNumberVerbetering van stemgelijkenis (0-1).
stabilityNumberSpraakstabiliteit (0-1).
styleNumberStijl-overdrijving (0-1).
use_speaker_boostBooleanSchakel speaker boost in.

Voorbeeld:

tts:
  elevenlabs:
    apiKey: "${ELEVENLABS_API_KEY}"
    model: "eleven_multilingual_v2"
    voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
    voice_settings:
      stability: 0.5
      similarity_boost: 0.75
      use_speaker_boost: true

localai

LocalAI TTS-configuratie voor self-hosted spraaksynthese.

KeyTypeDescriptionExample
urlStringURL van de LocalAI-server.Required
apiKeyStringAPI-sleutel indien authenticatie is ingeschakeld (optioneel).
voicesArray of StringsBeschikbare stemmodellen.Required
backendStringTe gebruiken TTS-backend (bijv. "piper").Required

Voorbeeld:

tts:
  localai:
    url: "http://localhost:8080"
    voices: ["en-us-amy-low", "en-us-danny-low"]
    backend: "piper"

stt

Het stt object configureert Speech-to-Text providers.

openai

OpenAI Whisper STT configuratie.

KeyTypeDescriptionExample
urlStringAangepaste API-URL (optioneel). Gebruik voor OpenAI-compatibele endpoints.
apiKeyStringOpenAI API-sleutel. Gebruik een omgevingsvariabele-referentie.Required
modelStringTe gebruiken STT-model (bijv. "whisper-1").Required

Voorbeeld:

stt:
  openai:
    apiKey: "${STT_API_KEY}"
    model: "whisper-1"

azureOpenAI

Azure OpenAI Whisper STT configuratie.

KeyTypeDescriptionExample
instanceNameStringAzure OpenAI exemplaarnaam.Required
apiKeyStringAzure OpenAI API-sleutel.Required
deploymentNameStringDe deployment-naam voor het Whisper-model.Required
apiVersionStringAzure OpenAI API-versie.Required

Voorbeeld:

stt:
  azureOpenAI:
    instanceName: "my-azure-instance"
    apiKey: "${AZURE_STT_API_KEY}"
    deploymentName: "whisper-deployment"
    apiVersion: "2024-02-15-preview"

speechTab

Het speechTab object configureert standaard UI-instellingen voor spraakfuncties. Deze instellingen bepalen wat gebruikers standaard zien in het paneel met spraakinstellingen.

KeyTypeDescriptionExample
conversationModeBooleanSchakel gespreksmodus standaard in.false
advancedModeBooleanToon standaard geavanceerde spraakinstellingen.false
speechToTextBoolean or ObjectSchakel STT standaard in, of configureer gedetailleerde STT-instellingen.false
textToSpeechBoolean or ObjectSchakel TTS standaard in, of configureer gedetailleerde TTS-instellingen.false

speechToText (Object-indeling)

Bij gebruik van een object in plaats van een boolean:

KeyTypeDescriptionExample
engineSTTStringStandaard STT-engine. Opties: `"openai"`, `"azureOpenAI"`.
languageSTTStringStandaardtaal voor STT.
autoTranscribeAudioBooleanTranscribeer audioberichten automatisch.
decibelValueNumberDecibeldrempel voor stemdetectie.
autoSendTextNumberVertraging in ms voordat getranscribeerde tekst automatisch wordt verzonden (0 om uit te schakelen).

textToSpeech (Object-indeling)

Bij gebruik van een object in plaats van een boolean:

KeyTypeDescriptionExample
engineTTSStringStandaard TTS-engine. Opties: `"openai"`, `"azureOpenAI"`, `"elevenlabs"`, `"localai"`.
voiceStringStandaard stemselectie.
languageTTSStringStandaardtaal voor TTS.
automaticPlaybackBooleanSpeel TTS-reacties automatisch af.
playbackRateNumberStandaard afspeelsnelheid (1.0 = normaal). Bereik: 0.25–4.0.
cacheTTSBooleanCache TTS-audio voor herhaald afspelen.

Voorbeeld:

speechTab:
  conversationMode: false
  advancedMode: false
  speechToText:
    engineSTT: "openai"
    autoTranscribeAudio: true
    decibelValue: -45
  textToSpeech:
    engineTTS: "openai"
    voice: "nova"
    automaticPlayback: false
    playbackRate: 1.0
    cacheTTS: true

Volledig voorbeeld

version: 1.3.10
cache: true

speech:
  tts:
    openai:
      apiKey: "${TTS_API_KEY}"
      model: "tts-1-hd"
      voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
    elevenlabs:
      apiKey: "${ELEVENLABS_API_KEY}"
      model: "eleven_multilingual_v2"
      voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
      voice_settings:
        stability: 0.5
        similarity_boost: 0.75
  stt:
    openai:
      apiKey: "${STT_API_KEY}"
      model: "whisper-1"
  speechTab:
    conversationMode: false
    advancedMode: false
    speechToText: true
    textToSpeech:
      engineTTS: "openai"
      voice: "nova"
      automaticPlayback: false

Opmerkingen

  • Gebruik altijd omgevingsvariabele-verwijzingen (bijv. ${API_KEY}) voor API-sleutels in configuratiebestanden
  • Meerdere TTS-providers kunnen worden geconfigureerd; gebruikers selecteren hun voorkeursoptie in de UI
  • De speechTab instellingen definiëren standaardwaarden die gebruikers kunnen overschrijven in hun persoonlijke instellingen
  • Voor gedetailleerde functiedocumentatie, zie Speech to Text & Text to Speech

Hoe is deze gids?