Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack 🎉 Learn more
LibreChat

Konuşma Yapılandırması

Genel Bakış

speech nesnesi, Metinden Konuşmaya (TTS) ve Konuştan Metne (STT) sağlayıcılarını doğrudan librechat.yaml yapılandırma dosyanızda yapılandırmanıza olanak tanır. Bu, kullanıcıların kendi API anahtarlarını yapılandırmasına gerek kalmadan sunucu tarafında konuşma hizmetlerini etkinleştirir.

speech altındaki alanlar:

  • tts - Metinden Konuşmaya (Text-to-Speech) sağlayıcı yapılandırmaları
  • stt - Speech-to-Text sağlayıcı yapılandırmaları
  • speechTab - Konuşma özellikleri için varsayılan arayüz ayarları

Notlar:

  • Birden fazla sağlayıcı aynı anda yapılandırılabilir
  • Kullanıcılar, mevcut seçenekler arasından tercih ettikleri sağlayıcıyı seçebilirler.
  • Yapılandırma dosyasındaki API anahtarları, güvenlik nedeniyle ortam değişkeni referanslarını kullanmalıdır

Örnek

speech:
  tts:
    openai:
      apiKey: "${TTS_API_KEY}"
      model: "tts-1"
      voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
    elevenlabs:
      apiKey: "${ELEVENLABS_API_KEY}"
      model: "eleven_multilingual_v2"
      voices: ["voice-id-1", "voice-id-2"]
  stt:
    openai:
      apiKey: "${STT_API_KEY}"
      model: "whisper-1"
  speechTab:
    conversationMode: true
    advancedMode: false
    speechToText: true
    textToSpeech: true

tts

tts nesnesi, Metin Okuma (Text-to-Speech) sağlayıcılarını yapılandırır. Birden fazla sağlayıcı yapılandırılabilir ve kullanıcılar hangisini kullanacaklarını seçebilirler.

openai

tts-1 veya tts-1-hd gibi modelleri kullanarak OpenAI TTS yapılandırması.

KeyTypeDescriptionExample
urlStringÖzel API URL'si (isteğe bağlı). OpenAI uyumlu endpoint'ler için kullanın.
apiKeyStringOpenAI API anahtarı. Ortam değişkeni referansını kullanın.Required
modelStringKullanılacak TTS modeli (örneğin, "tts-1", "tts-1-hd").Required
voicesArray of StringsKullanıcıların seçebileceği mevcut ses seçenekleri.Required

Örnek:

tts:
  openai:
    apiKey: "${TTS_API_KEY}"
    model: "tts-1"
    voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]

azureOpenAI

Azure OpenAI TTS yapılandırması.

KeyTypeDescriptionExample
instanceNameStringAzure OpenAI örnek adı.Required
apiKeyStringAzure OpenAI API anahtarı.Required
deploymentNameStringTTS modeli için deployment adı.Required
apiVersionStringAzure OpenAI API sürümü.Required
modelStringTTS model tanımlayıcısı.Required
voicesArray of StringsKullanılabilir ses seçenekleri.Required

Örnek:

tts:
  azureOpenAI:
    instanceName: "my-azure-instance"
    apiKey: "${AZURE_TTS_API_KEY}"
    deploymentName: "tts-deployment"
    apiVersion: "2024-02-15-preview"
    model: "tts-1"
    voices: ["alloy", "echo", "nova"]

elevenlabs

Yüksek kaliteli ses sentezi için ElevenLabs TTS yapılandırması.

KeyTypeDescriptionExample
urlStringÖzel API URL'si (isteğe bağlı).
websocketUrlStringAkış için WebSocket URL'si (isteğe bağlı).
apiKeyStringElevenLabs API anahtarı.Required
modelStringElevenLabs modeli (örneğin, "eleven_multilingual_v2").Required
voicesArray of StringsSeçim için kullanılabilir Ses Kimlikleri (Voice IDs).Required
voice_settingsObjectSes özelleştirme ayarları (isteğe bağlı).
pronunciation_dictionary_locatorsArray of StringsTelaffuz sözlüğü kimlikleri (isteğe bağlı).

voice_settings Alt anahtarları:

KeyTypeDescriptionExample
similarity_boostNumberSes benzerliği iyileştirmesi (0-1).
stabilityNumberSes kararlılığı (0-1).
styleNumberStil abartısı (0-1).
use_speaker_boostBooleanHoparlör güçlendirmeyi etkinleştir.

Örnek:

tts:
  elevenlabs:
    apiKey: "${ELEVENLABS_API_KEY}"
    model: "eleven_multilingual_v2"
    voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
    voice_settings:
      stability: 0.5
      similarity_boost: 0.75
      use_speaker_boost: true

localai

Kendi kendine barındırılan konuşma sentezi için LocalAI TTS yapılandırması.

KeyTypeDescriptionExample
urlStringLocalAI sunucu URL'si.Required
apiKeyStringKimlik doğrulama etkinse API anahtarı (isteğe bağlı).
voicesArray of StringsKullanılabilir ses modelleri.Required
backendStringKullanılacak TTS arka ucu (örneğin, "piper").Required

Örnek:

tts:
  localai:
    url: "http://localhost:8080"
    voices: ["en-us-amy-low", "en-us-danny-low"]
    backend: "piper"

stt

stt nesnesi, Speech-to-Text sağlayıcılarını yapılandırır.

openai

OpenAI Whisper STT yapılandırması.

KeyTypeDescriptionExample
urlStringÖzel API URL'si (isteğe bağlı). OpenAI uyumlu endpoint'ler için kullanın.
apiKeyStringOpenAI API anahtarı. Ortam değişkeni referansını kullanın.Required
modelStringKullanılacak STT modeli (örneğin, "whisper-1").Required

Örnek:

stt:
  openai:
    apiKey: "${STT_API_KEY}"
    model: "whisper-1"

azureOpenAI

Azure OpenAI Whisper STT yapılandırması.

KeyTypeDescriptionExample
instanceNameStringAzure OpenAI örnek adı.Required
apiKeyStringAzure OpenAI API anahtarı.Required
deploymentNameStringWhisper modeli için deployment adı.Required
apiVersionStringAzure OpenAI API sürümü.Required

Örnek:

stt:
  azureOpenAI:
    instanceName: "my-azure-instance"
    apiKey: "${AZURE_STT_API_KEY}"
    deploymentName: "whisper-deployment"
    apiVersion: "2024-02-15-preview"

speechTab

speechTab nesnesi, konuşma özellikleri için varsayılan arayüz ayarlarını yapılandırır. Bu ayarlar, kullanıcıların konuşma ayarları panelinde varsayılan olarak ne göreceğini kontrol eder.

KeyTypeDescriptionExample
conversationModeBooleanSohbet modunu varsayılan olarak etkinleştir.false
advancedModeBooleanGelişmiş konuşma ayarlarını varsayılan olarak göster.false
speechToTextBoolean or ObjectSTT'yi varsayılan olarak etkinleştirin veya ayrıntılı STT ayarlarını yapılandırın.false
textToSpeechBoolean or ObjectTTS'yi varsayılan olarak etkinleştirin veya ayrıntılı TTS ayarlarını yapılandırın.false

speechToText (Nesne formatı)

Boolean yerine bir nesne kullanırken:

KeyTypeDescriptionExample
engineSTTStringVarsayılan STT motoru. Seçenekler: `"openai"`, `"azureOpenAI"`.
languageSTTStringSTT için varsayılan dil.
autoTranscribeAudioBooleanSesli mesajları otomatik olarak yazıya dökün.
decibelValueNumberSes algılama için desibel eşiği.
autoSendTextNumberTranskribe edilen metnin otomatik gönderilmesinden önceki ms cinsinden gecikme (devre dışı bırakmak için 0).

textToSpeech (Nesne formatı)

Boolean yerine bir nesne kullanırken:

KeyTypeDescriptionExample
engineTTSStringVarsayılan TTS motoru. Seçenekler: `"openai"`, `"azureOpenAI"`, `"elevenlabs"`, `"localai"`.
voiceStringVarsayılan ses seçimi.
languageTTSStringTTS için varsayılan dil.
automaticPlaybackBooleanTTS yanıtlarını otomatik olarak oynat.
playbackRateNumberVarsayılan oynatma hızı (1.0 = normal). Aralık: 0.25–4.0.
cacheTTSBooleanTekrarlanan oynatmalar için TTS sesini önbelleğe al.

Örnek:

speechTab:
  conversationMode: false
  advancedMode: false
  speechToText:
    engineSTT: "openai"
    autoTranscribeAudio: true
    decibelValue: -45
  textToSpeech:
    engineTTS: "openai"
    voice: "nova"
    automaticPlayback: false
    playbackRate: 1.0
    cacheTTS: true

Tam Örnek

version: 1.3.10
cache: true

speech:
  tts:
    openai:
      apiKey: "${TTS_API_KEY}"
      model: "tts-1-hd"
      voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
    elevenlabs:
      apiKey: "${ELEVENLABS_API_KEY}"
      model: "eleven_multilingual_v2"
      voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
      voice_settings:
        stability: 0.5
        similarity_boost: 0.75
  stt:
    openai:
      apiKey: "${STT_API_KEY}"
      model: "whisper-1"
  speechTab:
    conversationMode: false
    advancedMode: false
    speechToText: true
    textToSpeech:
      engineTTS: "openai"
      voice: "nova"
      automaticPlayback: false

Notlar

  • Yapılandırma dosyalarındaki API anahtarları için her zaman ortam değişkeni referanslarını (örneğin, ${API_KEY}) kullanın
  • Birden fazla TTS sağlayıcısı yapılandırılabilir; kullanıcılar tercih ettikleri seçeneği arayüz üzerinden seçerler.
  • speechTab ayarları, kullanıcıların kişisel ayarlarından geçersiz kılabileceği varsayılan değerleri tanımlar
  • Ayrıntılı özellik belgeleri için Speech to Text & Text to Speech bölümüne bakın.

Bu rehber nasıl?