Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack 🎉 Learn more
LibreChat

Konfigurasi Ucapan

Ikhtisar

Objek speech memungkinkan Anda untuk mengonfigurasi penyedia Text-to-Speech (TTS) dan Speech-to-Text (STT) secara langsung di dalam file konfigurasi librechat.yaml Anda. Hal ini memungkinkan layanan ucapan sisi server tanpa mengharuskan pengguna untuk mengonfigurasi kunci API mereka sendiri.

Bidang di bawah speech:

  • tts - Konfigurasi penyedia Text-to-Speech
  • stt - Konfigurasi penyedia Speech-to-Text
  • speechTab - Pengaturan UI default untuk fitur ucapan

Catatan:

  • Beberapa penyedia dapat dikonfigurasi secara bersamaan
  • Pengguna dapat memilih penyedia pilihan mereka dari opsi yang tersedia
  • API keys dalam file config harus menggunakan referensi environment variable demi keamanan

Contoh

speech:
  tts:
    openai:
      apiKey: "${TTS_API_KEY}"
      model: "tts-1"
      voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
    elevenlabs:
      apiKey: "${ELEVENLABS_API_KEY}"
      model: "eleven_multilingual_v2"
      voices: ["voice-id-1", "voice-id-2"]
  stt:
    openai:
      apiKey: "${STT_API_KEY}"
      model: "whisper-1"
  speechTab:
    conversationMode: true
    advancedMode: false
    speechToText: true
    textToSpeech: true

tts

Objek tts mengonfigurasi penyedia Text-to-Speech. Beberapa penyedia dapat dikonfigurasi, dan pengguna dapat memilih mana yang akan digunakan.

openai

Konfigurasi OpenAI TTS menggunakan model seperti tts-1 atau tts-1-hd.

KeyTypeDescriptionExample
urlStringURL API Kustom (opsional). Gunakan untuk endpoint yang kompatibel dengan OpenAI.
apiKeyStringKunci API OpenAI. Gunakan referensi variabel lingkungan.Required
modelStringModel TTS yang akan digunakan (contoh: "tts-1", "tts-1-hd").Required
voicesArray of StringsPilihan suara yang tersedia untuk dipilih oleh pengguna.Required

Contoh:

tts:
  openai:
    apiKey: "${TTS_API_KEY}"
    model: "tts-1"
    voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]

azureOpenAI

Konfigurasi Azure OpenAI TTS.

KeyTypeDescriptionExample
instanceNameStringNama instance Azure OpenAI.Required
apiKeyStringKunci API Azure OpenAI.Required
deploymentNameStringNama deployment untuk model TTS.Required
apiVersionStringVersi API Azure OpenAI.Required
modelStringPengenal model TTS.Required
voicesArray of StringsOpsi suara yang tersedia.Required

Contoh:

tts:
  azureOpenAI:
    instanceName: "my-azure-instance"
    apiKey: "${AZURE_TTS_API_KEY}"
    deploymentName: "tts-deployment"
    apiVersion: "2024-02-15-preview"
    model: "tts-1"
    voices: ["alloy", "echo", "nova"]

elevenlabs

Konfigurasi ElevenLabs TTS untuk sintesis suara berkualitas tinggi.

KeyTypeDescriptionExample
urlStringURL API Kustom (opsional).
websocketUrlStringURL WebSocket untuk streaming (opsional).
apiKeyStringKunci API ElevenLabs.Required
modelStringModel ElevenLabs (contoh: "eleven_multilingual_v2").Required
voicesArray of StringsID Suara yang tersedia untuk dipilih.Required
voice_settingsObjectPengaturan kustomisasi suara (opsional).
pronunciation_dictionary_locatorsArray of StringsID kamus pelafalan (opsional).

Sub-key voice_settings:

KeyTypeDescriptionExample
similarity_boostNumberPeningkatan kemiripan suara (0-1).
stabilityNumberStabilitas suara (0-1).
styleNumberEksagerasi gaya (0-1).
use_speaker_boostBooleanAktifkan penguat speaker.

Contoh:

tts:
  elevenlabs:
    apiKey: "${ELEVENLABS_API_KEY}"
    model: "eleven_multilingual_v2"
    voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
    voice_settings:
      stability: 0.5
      similarity_boost: 0.75
      use_speaker_boost: true

localai

Konfigurasi TTS LocalAI untuk sintesis ucapan yang di-host sendiri.

KeyTypeDescriptionExample
urlStringURL server LocalAI.Required
apiKeyStringKunci API jika autentikasi diaktifkan (opsional).
voicesArray of StringsModel suara yang tersedia.Required
backendStringBackend TTS yang akan digunakan (contoh: "piper").Required

Contoh:

tts:
  localai:
    url: "http://localhost:8080"
    voices: ["en-us-amy-low", "en-us-danny-low"]
    backend: "piper"

stt

Objek stt mengonfigurasi penyedia Speech-to-Text.

openai

Konfigurasi OpenAI Whisper STT.

KeyTypeDescriptionExample
urlStringURL API Kustom (opsional). Gunakan untuk endpoint yang kompatibel dengan OpenAI.
apiKeyStringKunci API OpenAI. Gunakan referensi variabel lingkungan.Required
modelStringModel STT yang akan digunakan (contoh: "whisper-1").Required

Contoh:

stt:
  openai:
    apiKey: "${STT_API_KEY}"
    model: "whisper-1"

azureOpenAI

Konfigurasi Azure OpenAI Whisper STT.

KeyTypeDescriptionExample
instanceNameStringNama instance Azure OpenAI.Required
apiKeyStringKunci API Azure OpenAI.Required
deploymentNameStringNama deployment untuk model Whisper.Required
apiVersionStringVersi API Azure OpenAI.Required

Contoh:

stt:
  azureOpenAI:
    instanceName: "my-azure-instance"
    apiKey: "${AZURE_STT_API_KEY}"
    deploymentName: "whisper-deployment"
    apiVersion: "2024-02-15-preview"

speechTab

Objek speechTab mengonfigurasi pengaturan UI default untuk fitur ucapan. Pengaturan ini mengontrol apa yang dilihat pengguna secara default di panel pengaturan ucapan.

KeyTypeDescriptionExample
conversationModeBooleanAktifkan mode percakapan secara default.false
advancedModeBooleanTampilkan pengaturan ucapan tingkat lanjut secara default.false
speechToTextBoolean or ObjectAktifkan STT secara default, atau konfigurasikan pengaturan STT secara mendetail.false
textToSpeechBoolean or ObjectAktifkan TTS secara default, atau konfigurasikan pengaturan TTS secara mendetail.false

speechToText (Format objek)

Saat menggunakan objek alih-alih boolean:

KeyTypeDescriptionExample
engineSTTStringMesin STT default. Opsi: `"openai"`, `"azureOpenAI"`.
languageSTTStringBahasa default untuk STT.
autoTranscribeAudioBooleanTranskripsikan pesan audio secara otomatis.
decibelValueNumberAmbang batas desibel untuk deteksi suara.
autoSendTextNumberJeda dalam ms sebelum mengirim otomatis teks yang ditranskripsikan (0 untuk menonaktifkan).

textToSpeech (Format objek)

Saat menggunakan objek alih-alih boolean:

KeyTypeDescriptionExample
engineTTSStringMesin TTS default. Opsi: `"openai"`, `"azureOpenAI"`, `"elevenlabs"`, `"localai"`.
voiceStringPilihan suara default.
languageTTSStringBahasa default untuk TTS.
automaticPlaybackBooleanPutar respons TTS secara otomatis.
playbackRateNumberKecepatan pemutaran default (1.0 = normal). Rentang: 0.25–4.0.
cacheTTSBooleanCache audio TTS untuk pemutaran berulang.

Contoh:

speechTab:
  conversationMode: false
  advancedMode: false
  speechToText:
    engineSTT: "openai"
    autoTranscribeAudio: true
    decibelValue: -45
  textToSpeech:
    engineTTS: "openai"
    voice: "nova"
    automaticPlayback: false
    playbackRate: 1.0
    cacheTTS: true

Contoh Lengkap

version: 1.3.10
cache: true

speech:
  tts:
    openai:
      apiKey: "${TTS_API_KEY}"
      model: "tts-1-hd"
      voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
    elevenlabs:
      apiKey: "${ELEVENLABS_API_KEY}"
      model: "eleven_multilingual_v2"
      voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
      voice_settings:
        stability: 0.5
        similarity_boost: 0.75
  stt:
    openai:
      apiKey: "${STT_API_KEY}"
      model: "whisper-1"
  speechTab:
    conversationMode: false
    advancedMode: false
    speechToText: true
    textToSpeech:
      engineTTS: "openai"
      voice: "nova"
      automaticPlayback: false

Catatan

  • Selalu gunakan referensi variabel lingkungan (contoh: ${API_KEY}) untuk kunci API di dalam file konfigurasi
  • Beberapa penyedia TTS dapat dikonfigurasi; pengguna memilih opsi pilihan mereka di UI
  • Pengaturan speechTab menentukan nilai default yang dapat diganti oleh pengguna di pengaturan pribadi mereka
  • Untuk dokumentasi fitur terperinci, lihat Speech to Text & Text to Speech

Bagaimana panduan ini?