Konuşma Yapılandırması

Genel Bakış

speech nesnesi, Metinden Konuşmaya (TTS) ve Konuştan Metne (STT) sağlayıcılarını doğrudan librechat.yaml yapılandırma dosyanızda yapılandırmanıza olanak tanır. Bu, kullanıcıların kendi API anahtarlarını yapılandırmasına gerek kalmadan sunucu tarafında konuşma hizmetlerini etkinleştirir.

speech altındaki alanlar:

tts - Metinden Konuşmaya (Text-to-Speech) sağlayıcı yapılandırmaları
stt - Speech-to-Text sağlayıcı yapılandırmaları
speechTab - Konuşma özellikleri için varsayılan arayüz ayarları

Notlar:

Birden fazla sağlayıcı aynı anda yapılandırılabilir
Kullanıcılar, mevcut seçenekler arasından tercih ettikleri sağlayıcıyı seçebilirler.
Yapılandırma dosyasındaki API anahtarları, güvenlik nedeniyle ortam değişkeni referanslarını kullanmalıdır

Örnek

speech:
  tts:
    openai:
      apiKey: "${TTS_API_KEY}"
      model: "tts-1"
      voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
    elevenlabs:
      apiKey: "${ELEVENLABS_API_KEY}"
      model: "eleven_multilingual_v2"
      voices: ["voice-id-1", "voice-id-2"]
  stt:
    openai:
      apiKey: "${STT_API_KEY}"
      model: "whisper-1"
  speechTab:
    conversationMode: true
    advancedMode: false
    speechToText: true
    textToSpeech: true

tts

tts nesnesi, Metin Okuma (Text-to-Speech) sağlayıcılarını yapılandırır. Birden fazla sağlayıcı yapılandırılabilir ve kullanıcılar hangisini kullanacaklarını seçebilirler.

openai

tts-1 veya tts-1-hd gibi modelleri kullanarak OpenAI TTS yapılandırması.

Key	Type	Description	Example
url	String	Özel API URL'si (isteğe bağlı). OpenAI uyumlu endpoint'ler için kullanın.
apiKey	String	OpenAI API anahtarı. Ortam değişkeni referansını kullanın.	Required
model	String	Kullanılacak TTS modeli (örneğin, "tts-1", "tts-1-hd").	Required
voices	Array of Strings	Kullanıcıların seçebileceği mevcut ses seçenekleri.	Required

Örnek:

tts:
  openai:
    apiKey: "${TTS_API_KEY}"
    model: "tts-1"
    voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]

azureOpenAI

Azure OpenAI TTS yapılandırması.

Key	Type	Description	Example
instanceName	String	Azure OpenAI örnek adı.	Required
apiKey	String	Azure OpenAI API anahtarı.	Required
deploymentName	String	TTS modeli için deployment adı.	Required
apiVersion	String	Azure OpenAI API sürümü.	Required
model	String	TTS model tanımlayıcısı.	Required
voices	Array of Strings	Kullanılabilir ses seçenekleri.	Required

Örnek:

tts:
  azureOpenAI:
    instanceName: "my-azure-instance"
    apiKey: "${AZURE_TTS_API_KEY}"
    deploymentName: "tts-deployment"
    apiVersion: "2024-02-15-preview"
    model: "tts-1"
    voices: ["alloy", "echo", "nova"]

elevenlabs

Yüksek kaliteli ses sentezi için ElevenLabs TTS yapılandırması.

Key	Type	Description	Example
url	String	Özel API URL'si (isteğe bağlı).
websocketUrl	String	Akış için WebSocket URL'si (isteğe bağlı).
apiKey	String	ElevenLabs API anahtarı.	Required
model	String	ElevenLabs modeli (örneğin, "eleven_multilingual_v2").	Required
voices	Array of Strings	Seçim için kullanılabilir Ses Kimlikleri (Voice IDs).	Required
voice_settings	Object	Ses özelleştirme ayarları (isteğe bağlı).
pronunciation_dictionary_locators	Array of Strings	Telaffuz sözlüğü kimlikleri (isteğe bağlı).

voice_settings Alt anahtarları:

Key	Type	Description
similarity_boost	Number	Ses benzerliği iyileştirmesi (0-1).
stability	Number	Ses kararlılığı (0-1).
style	Number	Stil abartısı (0-1).
use_speaker_boost	Boolean	Hoparlör güçlendirmeyi etkinleştir.

Örnek:

tts:
  elevenlabs:
    apiKey: "${ELEVENLABS_API_KEY}"
    model: "eleven_multilingual_v2"
    voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
    voice_settings:
      stability: 0.5
      similarity_boost: 0.75
      use_speaker_boost: true

localai

Kendi kendine barındırılan konuşma sentezi için LocalAI TTS yapılandırması.

Key	Type	Description	Example
url	String	LocalAI sunucu URL'si.	Required
apiKey	String	Kimlik doğrulama etkinse API anahtarı (isteğe bağlı).
voices	Array of Strings	Kullanılabilir ses modelleri.	Required
backend	String	Kullanılacak TTS arka ucu (örneğin, "piper").	Required

Örnek:

tts:
  localai:
    url: "http://localhost:8080"
    voices: ["en-us-amy-low", "en-us-danny-low"]
    backend: "piper"

stt

stt nesnesi, Speech-to-Text sağlayıcılarını yapılandırır.

openai

OpenAI Whisper STT yapılandırması.

Key	Type	Description	Example
url	String	Özel API URL'si (isteğe bağlı). OpenAI uyumlu endpoint'ler için kullanın.
apiKey	String	OpenAI API anahtarı. Ortam değişkeni referansını kullanın.	Required
model	String	Kullanılacak STT modeli (örneğin, "whisper-1").	Required

Örnek:

stt:
  openai:
    apiKey: "${STT_API_KEY}"
    model: "whisper-1"

azureOpenAI

Azure OpenAI Whisper STT yapılandırması.

Key	Type	Description	Example
instanceName	String	Azure OpenAI örnek adı.	Required
apiKey	String	Azure OpenAI API anahtarı.	Required
deploymentName	String	Whisper modeli için deployment adı.	Required
apiVersion	String	Azure OpenAI API sürümü.	Required

Örnek:

stt:
  azureOpenAI:
    instanceName: "my-azure-instance"
    apiKey: "${AZURE_STT_API_KEY}"
    deploymentName: "whisper-deployment"
    apiVersion: "2024-02-15-preview"

speechTab

speechTab nesnesi, konuşma özellikleri için varsayılan arayüz ayarlarını yapılandırır. Bu ayarlar, kullanıcıların konuşma ayarları panelinde varsayılan olarak ne göreceğini kontrol eder.

Key	Type	Description	Example
conversationMode	Boolean	Sohbet modunu varsayılan olarak etkinleştir.	false
advancedMode	Boolean	Gelişmiş konuşma ayarlarını varsayılan olarak göster.	false
speechToText	Boolean or Object	STT'yi varsayılan olarak etkinleştirin veya ayrıntılı STT ayarlarını yapılandırın.	false
textToSpeech	Boolean or Object	TTS'yi varsayılan olarak etkinleştirin veya ayrıntılı TTS ayarlarını yapılandırın.	false

speechToText (Nesne formatı)

Boolean yerine bir nesne kullanırken:

Key	Type	Description
engineSTT	String	Varsayılan STT motoru. Seçenekler: `"openai"`, `"azureOpenAI"`.
languageSTT	String	STT için varsayılan dil.
autoTranscribeAudio	Boolean	Sesli mesajları otomatik olarak yazıya dökün.
decibelValue	Number	Ses algılama için desibel eşiği.
autoSendText	Number	Transkribe edilen metnin otomatik gönderilmesinden önceki ms cinsinden gecikme (devre dışı bırakmak için 0).

textToSpeech (Nesne formatı)

Boolean yerine bir nesne kullanırken:

Key	Type	Description
engineTTS	String	Varsayılan TTS motoru. Seçenekler: `"openai"`, `"azureOpenAI"`, `"elevenlabs"`, `"localai"`.
voice	String	Varsayılan ses seçimi.
languageTTS	String	TTS için varsayılan dil.
automaticPlayback	Boolean	TTS yanıtlarını otomatik olarak oynat.
playbackRate	Number	Varsayılan oynatma hızı (1.0 = normal). Aralık: 0.25–4.0.
cacheTTS	Boolean	Tekrarlanan oynatmalar için TTS sesini önbelleğe al.

Örnek:

speechTab:
  conversationMode: false
  advancedMode: false
  speechToText:
    engineSTT: "openai"
    autoTranscribeAudio: true
    decibelValue: -45
  textToSpeech:
    engineTTS: "openai"
    voice: "nova"
    automaticPlayback: false
    playbackRate: 1.0
    cacheTTS: true

Tam Örnek

version: 1.3.10
cache: true

speech:
  tts:
    openai:
      apiKey: "${TTS_API_KEY}"
      model: "tts-1-hd"
      voices: ["alloy", "echo", "fable", "onyx", "nova", "shimmer"]
    elevenlabs:
      apiKey: "${ELEVENLABS_API_KEY}"
      model: "eleven_multilingual_v2"
      voices: ["21m00Tcm4TlvDq8ikWAM", "AZnzlk1XvdvUeBnXmlld"]
      voice_settings:
        stability: 0.5
        similarity_boost: 0.75
  stt:
    openai:
      apiKey: "${STT_API_KEY}"
      model: "whisper-1"
  speechTab:
    conversationMode: false
    advancedMode: false
    speechToText: true
    textToSpeech:
      engineTTS: "openai"
      voice: "nova"
      automaticPlayback: false

Notlar

Yapılandırma dosyalarındaki API anahtarları için her zaman ortam değişkeni referanslarını (örneğin, ${API_KEY}) kullanın
Birden fazla TTS sağlayıcısı yapılandırılabilir; kullanıcılar tercih ettikleri seçeneği arayüz üzerinden seçerler.
speechTab ayarları, kullanıcıların kişisel ayarlarından geçersiz kılabileceği varsayılan değerleri tanımlar
Ayrıntılı özellik belgeleri için Speech to Text & Text to Speech bölümüne bakın.

Konuşma Yapılandırması

Bu sayfada