Konfigurasi Ucapan

Ikhtisar

Objek speech memungkinkan Anda untuk mengonfigurasi penyedia Text-to-Speech (TTS) dan Speech-to-Text (STT) secara langsung di dalam file konfigurasi librechat.yaml Anda. Hal ini memungkinkan layanan ucapan sisi server tanpa mengharuskan pengguna untuk mengonfigurasi kunci API mereka sendiri.

Bidang di bawah speech:

tts - Konfigurasi penyedia Text-to-Speech
stt - Konfigurasi penyedia Speech-to-Text
speechTab - Pengaturan UI default untuk fitur ucapan

Catatan:

Beberapa penyedia dapat dikonfigurasi secara bersamaan
Pengguna dapat memilih penyedia pilihan mereka dari opsi yang tersedia
API keys dalam file config harus menggunakan referensi environment variable demi keamanan

Contoh

speech:
  tts:
    openai:
      apiKey: "${TTS_API_KEY}"
      model: "tts-1"
      voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
    elevenlabs:
      apiKey: "${ELEVENLABS_API_KEY}"
      model: "eleven_multilingual_v2"
      voices: ["voice-id-1", "voice-id-2"]
  stt:
    openai:
      apiKey: "${STT_API_KEY}"
      model: "whisper-1"
  speechTab:
    conversationMode: true
    advancedMode: false
    speechToText: true
    textToSpeech: true

tts

Objek tts mengonfigurasi penyedia Text-to-Speech. Beberapa penyedia dapat dikonfigurasi, dan pengguna dapat memilih mana yang akan digunakan.

openai

Konfigurasi OpenAI TTS menggunakan model seperti tts-1 atau tts-1-hd.

Key	Type	Description	Example
url	String	URL API Kustom (opsional). Gunakan untuk endpoint yang kompatibel dengan OpenAI.
apiKey	String	Kunci API OpenAI. Gunakan referensi variabel lingkungan.	Required
model	String	Model TTS yang akan digunakan (contoh: "tts-1", "tts-1-hd").	Required
voices	Array of Strings	Pilihan suara yang tersedia untuk dipilih oleh pengguna.	Required

Contoh:

tts:
  openai:
    apiKey: "${TTS_API_KEY}"
    model: "tts-1"
    voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]

azureOpenAI

Konfigurasi Azure OpenAI TTS.

Key	Type	Description	Example
instanceName	String	Nama instance Azure OpenAI.	Required
apiKey	String	Kunci API Azure OpenAI.	Required
deploymentName	String	Nama deployment untuk model TTS.	Required
apiVersion	String	Versi API Azure OpenAI.	Required
model	String	Pengenal model TTS.	Required
voices	Array of Strings	Opsi suara yang tersedia.	Required

Contoh:

tts:
  azureOpenAI:
    instanceName: "my-azure-instance"
    apiKey: "${AZURE_TTS_API_KEY}"
    deploymentName: "tts-deployment"
    apiVersion: "2024-02-15-preview"
    model: "tts-1"
    voices: ["alloy", "echo", "nova"]

elevenlabs

Konfigurasi ElevenLabs TTS untuk sintesis suara berkualitas tinggi.

Key	Type	Description	Example
url	String	URL API Kustom (opsional).
websocketUrl	String	URL WebSocket untuk streaming (opsional).
apiKey	String	Kunci API ElevenLabs.	Required
model	String	Model ElevenLabs (contoh: "eleven_multilingual_v2").	Required
voices	Array of Strings	ID Suara yang tersedia untuk dipilih.	Required
voice_settings	Object	Pengaturan kustomisasi suara (opsional).
pronunciation_dictionary_locators	Array of Strings	ID kamus pelafalan (opsional).

Sub-key voice_settings:

Key	Type	Description
similarity_boost	Number	Peningkatan kemiripan suara (0-1).
stability	Number	Stabilitas suara (0-1).
style	Number	Eksagerasi gaya (0-1).
use_speaker_boost	Boolean	Aktifkan penguat speaker.

Contoh:

tts:
  elevenlabs:
    apiKey: "${ELEVENLABS_API_KEY}"
    model: "eleven_multilingual_v2"
    voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
    voice_settings:
      stability: 0.5
      similarity_boost: 0.75
      use_speaker_boost: true

localai

Konfigurasi TTS LocalAI untuk sintesis ucapan yang di-host sendiri.

Key	Type	Description	Example
url	String	URL server LocalAI.	Required
apiKey	String	Kunci API jika autentikasi diaktifkan (opsional).
voices	Array of Strings	Model suara yang tersedia.	Required
backend	String	Backend TTS yang akan digunakan (contoh: "piper").	Required

Contoh:

tts:
  localai:
    url: "http://localhost:8080"
    voices: ["en-us-amy-low", "en-us-danny-low"]
    backend: "piper"

stt

Objek stt mengonfigurasi penyedia Speech-to-Text.

openai

Konfigurasi OpenAI Whisper STT.

Key	Type	Description	Example
url	String	URL API Kustom (opsional). Gunakan untuk endpoint yang kompatibel dengan OpenAI.
apiKey	String	Kunci API OpenAI. Gunakan referensi variabel lingkungan.	Required
model	String	Model STT yang akan digunakan (contoh: "whisper-1").	Required

Contoh:

stt:
  openai:
    apiKey: "${STT_API_KEY}"
    model: "whisper-1"

azureOpenAI

Konfigurasi Azure OpenAI Whisper STT.

Key	Type	Description	Example
instanceName	String	Nama instance Azure OpenAI.	Required
apiKey	String	Kunci API Azure OpenAI.	Required
deploymentName	String	Nama deployment untuk model Whisper.	Required
apiVersion	String	Versi API Azure OpenAI.	Required

Contoh:

stt:
  azureOpenAI:
    instanceName: "my-azure-instance"
    apiKey: "${AZURE_STT_API_KEY}"
    deploymentName: "whisper-deployment"
    apiVersion: "2024-02-15-preview"

speechTab

Objek speechTab mengonfigurasi pengaturan UI default untuk fitur ucapan. Pengaturan ini mengontrol apa yang dilihat pengguna secara default di panel pengaturan ucapan.

Key	Type	Description	Example
conversationMode	Boolean	Aktifkan mode percakapan secara default.	false
advancedMode	Boolean	Tampilkan pengaturan ucapan tingkat lanjut secara default.	false
speechToText	Boolean or Object	Aktifkan STT secara default, atau konfigurasikan pengaturan STT secara mendetail.	false
textToSpeech	Boolean or Object	Aktifkan TTS secara default, atau konfigurasikan pengaturan TTS secara mendetail.	false

speechToText (Format objek)

Saat menggunakan objek alih-alih boolean:

Key	Type	Description
engineSTT	String	Mesin STT default. Opsi: `"openai"`, `"azureOpenAI"`.
languageSTT	String	Bahasa default untuk STT.
autoTranscribeAudio	Boolean	Transkripsikan pesan audio secara otomatis.
decibelValue	Number	Ambang batas desibel untuk deteksi suara.
autoSendText	Number	Jeda dalam ms sebelum mengirim otomatis teks yang ditranskripsikan (0 untuk menonaktifkan).

textToSpeech (Format objek)

Saat menggunakan objek alih-alih boolean:

Key	Type	Description
engineTTS	String	Mesin TTS default. Opsi: `"openai"`, `"azureOpenAI"`, `"elevenlabs"`, `"localai"`.
voice	String	Pilihan suara default.
languageTTS	String	Bahasa default untuk TTS.
automaticPlayback	Boolean	Putar respons TTS secara otomatis.
playbackRate	Number	Kecepatan pemutaran default (1.0 = normal). Rentang: 0.25–4.0.
cacheTTS	Boolean	Cache audio TTS untuk pemutaran berulang.

Contoh:

speechTab:
  conversationMode: false
  advancedMode: false
  speechToText:
    engineSTT: "openai"
    autoTranscribeAudio: true
    decibelValue: -45
  textToSpeech:
    engineTTS: "openai"
    voice: "nova"
    automaticPlayback: false
    playbackRate: 1.0
    cacheTTS: true

Contoh Lengkap

version: 1.3.10
cache: true

speech:
  tts:
    openai:
      apiKey: "${TTS_API_KEY}"
      model: "tts-1-hd"
      voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
    elevenlabs:
      apiKey: "${ELEVENLABS_API_KEY}"
      model: "eleven_multilingual_v2"
      voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
      voice_settings:
        stability: 0.5
        similarity_boost: 0.75
  stt:
    openai:
      apiKey: "${STT_API_KEY}"
      model: "whisper-1"
  speechTab:
    conversationMode: false
    advancedMode: false
    speechToText: true
    textToSpeech:
      engineTTS: "openai"
      voice: "nova"
      automaticPlayback: false

Catatan

Selalu gunakan referensi variabel lingkungan (contoh: ${API_KEY}) untuk kunci API di dalam file konfigurasi
Beberapa penyedia TTS dapat dikonfigurasi; pengguna memilih opsi pilihan mereka di UI
Pengaturan speechTab menentukan nilai default yang dapat diganti oleh pengguna di pengaturan pribadi mereka
Untuk dokumentasi fitur terperinci, lihat Speech to Text & Text to Speech

Konfigurasi Ucapan

Di halaman ini