Spracheinstellungen
Konfiguration der Speech-to-Text (STT)- und Text-to-Speech (TTS)-Funktionen
Einführung zur Sprachausgabe
Die Sprachkonfiguration umfasst Einstellungen für sowohl Speech-to-Text (STT) als auch Text-to-Speech (TTS) unter einem vereinheitlichten speech:-Abschnitt. Zusätzlich gibt es ein neues speechTab-Menü für benutzerspezifische Einstellungen.
Siehe auch: Für ein detailliertes YAML-Konfigurationsschema und alle verfügbaren Optionen siehe die Dokumentation zur Speech Object Structure.
Umgebungsvariablen
Wenn Sie cloudbasierte STT/TTS-Dienste verwenden, müssen Sie die API-Schlüssel in Ihrer .env Datei festlegen:
Diese Schlüssel werden dann in Ihrer librechat.yaml Konfiguration unter Verwendung von ${STT_API_KEY} und ${TTS_API_KEY} referenziert.
Tab „Sprache“ (optional)
Das speechTab-Menü bietet anpassbare Optionen für Konversations- und erweiterte Modi sowie detaillierte Einstellungen für STT und TTS. Dies legt die Standardeinstellungen für Benutzer fest.
Beispiel:
STT (Speech-to-Text)
Die Speech-to-Text (STT)-Funktion wandelt gesprochene Wörter in geschriebenen Text um. Um STT zu aktivieren, klicken Sie auf die STT-Schaltfläche (in der Nähe der Senden-Schaltfläche) oder verwenden Sie die Tastenkombination ++Ctrl+Alt+L++, um die Transkription zu starten.
Verfügbare STT-Dienste
- Lokale STT
- Browser-basiert
- Whisper (getestet auf LocalAI)
- Cloud-STT
- OpenAI Whisper
- Azure Whisper
- Andere OpenAI-kompatible STT-Dienste
Lokale STT konfigurieren
-
Browser-based
Keine Einrichtung erforderlich. Stellen Sie sicher, dass der Schalter "Speech To Text" im Tab für Spracheinstellungen aktiviert ist und "Browser" im Engine-Dropdown-Menü ausgewählt wurde.
-
Whisper Local
Erfordert eine lokale Whisper-Instanz.
Konfiguration von Cloud STT
Unterstützung für Azure Endpoint-Domains
Das Feld instanceName unterstützt beide Azure OpenAI-Domainformate:
- Neues Format:
.cognitiveservices.azure.com(z. B.my-instance.cognitiveservices.azure.com) - Legacy-Format:
.openai.azure.com(z. B.my-instance.openai.azure.com)
Sie können entweder die vollständige Domain oder nur den Instanznamen angeben. Wenn Sie eine vollständige Domain einschließlich .azure.com angeben, wird diese unverändert verwendet. Andernfalls wird aus Gründen der Abwärtskompatibilität das ältere Format .openai.azure.com angewendet.
Siehe den Abschnitt OpenAI Whisper und passe die url sowie das model nach Bedarf an.
Beispiel
TTS (Text-to-Speech)
Die Text-to-Speech (TTS)-Funktion wandelt geschriebenen Text in gesprochene Worte um. Es stehen verschiedene TTS-Dienste zur Verfügung:
Verfügbare TTS-Dienste
- Lokales TTS
- Browser-basiert
- Piper (getestet auf LocalAI)
- Coqui (getestet mit LocalAI)
- Cloud TTS
- OpenAI TTS
- Azure OpenAI
- ElevenLabs
- Andere mit OpenAI/ElevenLabs kompatible TTS-Dienste
Lokale TTS konfigurieren
Keine Einrichtung erforderlich. Stellen Sie sicher, dass der Schalter "Text To Speech" im Tab für Spracheinstellungen aktiviert ist und "Browser" im Engine-Dropdown-Menü ausgewählt wurde.
Erfordert eine lokale Piper-Instanz.
Erfordert eine lokale Coqui-Instanz.
Konfiguration von Cloud TTS
Unterstützung für Azure Endpoint-Domains
Das Feld instanceName unterstützt beide Azure OpenAI-Domainformate:
- Neues Format:
.cognitiveservices.azure.com(z. B.my-instance.cognitiveservices.azure.com) - Legacy-Format:
.openai.azure.com(z. B.my-instance.openai.azure.com)
Sie können entweder die vollständige Domain oder nur den Instanznamen angeben. Wenn Sie eine vollständige Domain einschließlich .azure.com angeben, wird diese unverändert verwendet. Andernfalls wird aus Gründen der Abwärtskompatibilität das ältere Format .openai.azure.com angewendet.
Zusätzliche ElevenLabs-spezifische Parameter können wie folgt hinzugefügt werden:
Siehe den OpenAI TTS Abschnitt und passe die url Variable nach Bedarf an.
Beispiel:
Siehe den Abschnitt ElevenLabs und passe die Variable url nach Bedarf an.
Beispiel:
Wie finden Sie diese Anleitung?