Konfigurasi Ucapan
Ikhtisar
Objek speech memungkinkan Anda untuk mengonfigurasi penyedia Text-to-Speech (TTS) dan Speech-to-Text (STT) secara langsung di dalam file konfigurasi librechat.yaml Anda. Hal ini memungkinkan layanan ucapan sisi server tanpa mengharuskan pengguna untuk mengonfigurasi kunci API mereka sendiri.
Bidang di bawah speech:
tts- Konfigurasi penyedia Text-to-Speechstt- Konfigurasi penyedia Speech-to-TextspeechTab- Pengaturan UI default untuk fitur ucapan
Catatan:
- Beberapa penyedia dapat dikonfigurasi secara bersamaan
- Pengguna dapat memilih penyedia pilihan mereka dari opsi yang tersedia
- API keys dalam file config harus menggunakan referensi environment variable demi keamanan
Contoh
speech:
tts:
openai:
apiKey: "${TTS_API_KEY}"
model: "tts-1"
voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
elevenlabs:
apiKey: "${ELEVENLABS_API_KEY}"
model: "eleven_multilingual_v2"
voices: ["voice-id-1", "voice-id-2"]
stt:
openai:
apiKey: "${STT_API_KEY}"
model: "whisper-1"
speechTab:
conversationMode: true
advancedMode: false
speechToText: true
textToSpeech: truetts
Objek tts mengonfigurasi penyedia Text-to-Speech. Beberapa penyedia dapat dikonfigurasi, dan pengguna dapat memilih mana yang akan digunakan.
openai
Konfigurasi OpenAI TTS menggunakan model seperti tts-1 atau tts-1-hd.
| Key | Type | Description | Example |
|---|---|---|---|
| url | String | URL API Kustom (opsional). Gunakan untuk endpoint yang kompatibel dengan OpenAI. | |
| apiKey | String | Kunci API OpenAI. Gunakan referensi variabel lingkungan. | Required |
| model | String | Model TTS yang akan digunakan (contoh: "tts-1", "tts-1-hd"). | Required |
| voices | Array of Strings | Pilihan suara yang tersedia untuk dipilih oleh pengguna. | Required |
Contoh:
tts:
openai:
apiKey: "${TTS_API_KEY}"
model: "tts-1"
voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]azureOpenAI
Konfigurasi Azure OpenAI TTS.
| Key | Type | Description | Example |
|---|---|---|---|
| instanceName | String | Nama instance Azure OpenAI. | Required |
| apiKey | String | Kunci API Azure OpenAI. | Required |
| deploymentName | String | Nama deployment untuk model TTS. | Required |
| apiVersion | String | Versi API Azure OpenAI. | Required |
| model | String | Pengenal model TTS. | Required |
| voices | Array of Strings | Opsi suara yang tersedia. | Required |
Contoh:
tts:
azureOpenAI:
instanceName: "my-azure-instance"
apiKey: "${AZURE_TTS_API_KEY}"
deploymentName: "tts-deployment"
apiVersion: "2024-02-15-preview"
model: "tts-1"
voices: ["alloy", "echo", "nova"]elevenlabs
Konfigurasi ElevenLabs TTS untuk sintesis suara berkualitas tinggi.
| Key | Type | Description | Example |
|---|---|---|---|
| url | String | URL API Kustom (opsional). | |
| websocketUrl | String | URL WebSocket untuk streaming (opsional). | |
| apiKey | String | Kunci API ElevenLabs. | Required |
| model | String | Model ElevenLabs (contoh: "eleven_multilingual_v2"). | Required |
| voices | Array of Strings | ID Suara yang tersedia untuk dipilih. | Required |
| voice_settings | Object | Pengaturan kustomisasi suara (opsional). | |
| pronunciation_dictionary_locators | Array of Strings | ID kamus pelafalan (opsional). |
Sub-key voice_settings:
| Key | Type | Description | Example |
|---|---|---|---|
| similarity_boost | Number | Peningkatan kemiripan suara (0-1). | |
| stability | Number | Stabilitas suara (0-1). | |
| style | Number | Eksagerasi gaya (0-1). | |
| use_speaker_boost | Boolean | Aktifkan penguat speaker. |
Contoh:
tts:
elevenlabs:
apiKey: "${ELEVENLABS_API_KEY}"
model: "eleven_multilingual_v2"
voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
voice_settings:
stability: 0.5
similarity_boost: 0.75
use_speaker_boost: truelocalai
Konfigurasi TTS LocalAI untuk sintesis ucapan yang di-host sendiri.
| Key | Type | Description | Example |
|---|---|---|---|
| url | String | URL server LocalAI. | Required |
| apiKey | String | Kunci API jika autentikasi diaktifkan (opsional). | |
| voices | Array of Strings | Model suara yang tersedia. | Required |
| backend | String | Backend TTS yang akan digunakan (contoh: "piper"). | Required |
Contoh:
tts:
localai:
url: "http://localhost:8080"
voices: ["en-us-amy-low", "en-us-danny-low"]
backend: "piper"stt
Objek stt mengonfigurasi penyedia Speech-to-Text.
openai
Konfigurasi OpenAI Whisper STT.
| Key | Type | Description | Example |
|---|---|---|---|
| url | String | URL API Kustom (opsional). Gunakan untuk endpoint yang kompatibel dengan OpenAI. | |
| apiKey | String | Kunci API OpenAI. Gunakan referensi variabel lingkungan. | Required |
| model | String | Model STT yang akan digunakan (contoh: "whisper-1"). | Required |
Contoh:
stt:
openai:
apiKey: "${STT_API_KEY}"
model: "whisper-1"azureOpenAI
Konfigurasi Azure OpenAI Whisper STT.
| Key | Type | Description | Example |
|---|---|---|---|
| instanceName | String | Nama instance Azure OpenAI. | Required |
| apiKey | String | Kunci API Azure OpenAI. | Required |
| deploymentName | String | Nama deployment untuk model Whisper. | Required |
| apiVersion | String | Versi API Azure OpenAI. | Required |
Contoh:
stt:
azureOpenAI:
instanceName: "my-azure-instance"
apiKey: "${AZURE_STT_API_KEY}"
deploymentName: "whisper-deployment"
apiVersion: "2024-02-15-preview"speechTab
Objek speechTab mengonfigurasi pengaturan UI default untuk fitur ucapan. Pengaturan ini mengontrol apa yang dilihat pengguna secara default di panel pengaturan ucapan.
| Key | Type | Description | Example |
|---|---|---|---|
| conversationMode | Boolean | Aktifkan mode percakapan secara default. | false |
| advancedMode | Boolean | Tampilkan pengaturan ucapan tingkat lanjut secara default. | false |
| speechToText | Boolean or Object | Aktifkan STT secara default, atau konfigurasikan pengaturan STT secara mendetail. | false |
| textToSpeech | Boolean or Object | Aktifkan TTS secara default, atau konfigurasikan pengaturan TTS secara mendetail. | false |
speechToText (Format objek)
Saat menggunakan objek alih-alih boolean:
| Key | Type | Description | Example |
|---|---|---|---|
| engineSTT | String | Mesin STT default. Opsi: `"openai"`, `"azureOpenAI"`. | |
| languageSTT | String | Bahasa default untuk STT. | |
| autoTranscribeAudio | Boolean | Transkripsikan pesan audio secara otomatis. | |
| decibelValue | Number | Ambang batas desibel untuk deteksi suara. | |
| autoSendText | Number | Jeda dalam ms sebelum mengirim otomatis teks yang ditranskripsikan (0 untuk menonaktifkan). |
textToSpeech (Format objek)
Saat menggunakan objek alih-alih boolean:
| Key | Type | Description | Example |
|---|---|---|---|
| engineTTS | String | Mesin TTS default. Opsi: `"openai"`, `"azureOpenAI"`, `"elevenlabs"`, `"localai"`. | |
| voice | String | Pilihan suara default. | |
| languageTTS | String | Bahasa default untuk TTS. | |
| automaticPlayback | Boolean | Putar respons TTS secara otomatis. | |
| playbackRate | Number | Kecepatan pemutaran default (1.0 = normal). Rentang: 0.25–4.0. | |
| cacheTTS | Boolean | Cache audio TTS untuk pemutaran berulang. |
Contoh:
speechTab:
conversationMode: false
advancedMode: false
speechToText:
engineSTT: "openai"
autoTranscribeAudio: true
decibelValue: -45
textToSpeech:
engineTTS: "openai"
voice: "nova"
automaticPlayback: false
playbackRate: 1.0
cacheTTS: trueContoh Lengkap
version: 1.3.10
cache: true
speech:
tts:
openai:
apiKey: "${TTS_API_KEY}"
model: "tts-1-hd"
voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
elevenlabs:
apiKey: "${ELEVENLABS_API_KEY}"
model: "eleven_multilingual_v2"
voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
voice_settings:
stability: 0.5
similarity_boost: 0.75
stt:
openai:
apiKey: "${STT_API_KEY}"
model: "whisper-1"
speechTab:
conversationMode: false
advancedMode: false
speechToText: true
textToSpeech:
engineTTS: "openai"
voice: "nova"
automaticPlayback: falseCatatan
- Selalu gunakan referensi variabel lingkungan (contoh:
${API_KEY}) untuk kunci API di dalam file konfigurasi - Beberapa penyedia TTS dapat dikonfigurasi; pengguna memilih opsi pilihan mereka di UI
- Pengaturan
speechTabmenentukan nilai default yang dapat diganti oleh pengguna di pengaturan pribadi mereka - Untuk dokumentasi fitur terperinci, lihat Speech to Text & Text to Speech
Bagaimana panduan ini?