Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack 🎉 Learn more
LibreChat

Dosyaları Metin Olarak Yükle

Herhangi bir dosyayı sohbetinize sürükleyip bırakın ve LibreChat'in onu okumasını sağlayın; hiçbir kurulum gerekmez.

Dosyaları Metin Olarak Yükle

Hiç bir PDF'i, kod dosyasını veya elektronik tabloyu yapay zekaya verip sadece "bunu oku" demek istediniz mi? Upload as Text tam olarak bunu yapar.

Bir dosya eklediğinizde LibreChat içindeki metni çıkarır ve tüm içerik doğrudan konuşmanıza yapıştırılır. Yapay zeka, herhangi bir eklentiye, vektör veritabanına veya yapılandırılacak ekstra hizmetlere ihtiyaç duymadan metindeki her kelimeyi okuyabilir. Kutudan çıktığı gibi çalışır.

Kurulum gerektirmez

Upload as Text, herhangi bir LibreChat örneğinde anında çalışır. Yerleşik metin ayrıştırma özelliğini kullanır; başlamak için OCR, RAG hattı veya herhangi bir harici hizmete ihtiyacınız yoktur.


Nasıl kullanılır

Ek simgesine tıklayın

Sohbet giriş çubuğundaki ataç (📎) simgesine tıklayın.

"Metin Olarak Yükle"yi seçin

Açılır menüden Upload as Text seçeneğini belirleyin. Bu, LibreChat'e dosya içeriğini ham bir ek olarak iletmek yerine okuması talimatını verir.

Dosyanızı seçin

Cihazınızdan dosyayı seçin. LibreChat metni çıkaracak ve doğrudan mesajınızın içine gömecektir.

Sorunuzu sorun

İsteminizi her zamanki gibi yazın. Yapay zeka artık dosyanızın tam metnine bağlam içinde sahiptir ve dosyanın herhangi bir kısmına referans verebilir.

Seçeneği göremiyor musunuz?

"Upload as Text" görünmüyorsa, context yeteneği yöneticiniz tarafından devre dışı bırakılmış olabilir. Bu özellik varsayılan olarak açıktır; ancak yetenekler listesi özelleştirildiyse, context öğesinin açıkça dahil edilmesi gerekir. Aşağıdaki yapılandırma bölümüne bakın.


Arka planda neler oluyor

Bir dosyayı bu şekilde yüklediğinizde, LibreChat ham baytları doğrudan isteme (prompt) dökmez. Temiz ve okunabilir metni çıkarmak için bir işleme hattı üzerinden çalıştırır:

  1. MIME türü algılama — LibreChat, yüklediğiniz dosyanın türünü (PDF, görsel, ses, kaynak kodu vb.) MIME türünü inceleyerek kontrol eder.
  2. Yöntem seçimi — Dosya türüne ve hangi hizmetlerin kullanılabilir olduğuna bağlı olarak, aşağıdaki öncelik sırasını kullanarak en iyi ayıklama yöntemini seçer:
ÖncelikYöntemNe zaman kullanılır
1.OCRDosya bir resim veya taranmış belgeyse ve OCR yapılandırılmışsa
2.STT (Konuşmadan Metne)Dosya ses dosyasıysa ve STT yapılandırılmışsa
3.Metin ayrıştırmaDosya bilinen bir metin MIME türüyle eşleşiyorsa
4.Yedek (Fallback)Yukarıdakilerden hiçbiri eşleşmediyse — yine de metin ayrıştırmayı dener

OCR yapılandırılmış bir örnek üzerinde bir .pdf dosyası: → OCR devreye girer. Taranmış belgeler ve karmaşık düzenler için harikadır.

Varsayılan bir örnekte (OCR olmadan) bir .pdf dosyası: → Metin ayrıştırma işlemi bunu halleder. Dijital olarak oluşturulmuş PDF'ler için iyi çalışır.

Bir .py Python dosyası: → Doğrudan metin ayrıştırmaya. Kaynak kod zaten metindir — dönüştürmeye gerek yoktur.

STT yapılandırılmış bir örnekte bir .mp3 dosyası: → Speech-to-Text, bunu konuşma için metne dönüştürür.

OCR yapılandırılmamış bir .png ekran görüntüsü: → Metin ayrıştırmaya geri döner (sınırlı sonuçlar — görüntüler için OCR kurulumu yapmayı düşünün).

  1. Token kırpma — Çıkarılan metin, modelin bağlam penceresini aşmaması için fileTokenLimit (varsayılan: 100.000 token) değerine göre kırpılır.
  2. Prompt injection — Metin, mesajınızla birlikte doğrudan konuşma bağlamına dahil edilir.

Hangi dosyalar destekleniyor

Bunlar doğrudan ayrıştırılır — zaten metin oldukları için herhangi bir dönüştürmeye gerek yoktur.

  • Düz metin (.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS
  • Programlama dilleri — Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
  • Yapılandırma dosyaları — YAML, TOML, INI
  • Shell betikleri, SQL dosyaları

Metin ayrıştırma (text parsing) bunları kutudan çıktığı haliyle işler. Eğer OCR yapılandırılmışsa, karmaşık düzenlerde daha iyi doğruluk için kontrolü devralır.

  • PDF — dijital ve taranmış (taranmış PDF'ler OCR'dan yararlanır)
  • Word.docx, .doc
  • PowerPoint.pptx, .ppt
  • Excel.xlsx, .xls
  • EPUB kitapları

Görüntülerin yararlı metinler üretmesi için OCR gereklidir. Aksi takdirde sonuçlar yetersiz olacaktır.

  • JPEG, PNG, GIF, WebP
  • HEIC, HEIF (Apple formatları)
  • Ekran görüntüleri, belge fotoğrafları, taranmış sayfalar

Ses dosyaları için STT yapılandırılmış olmalıdır. Bir geri dönüş (fallback) mekanizması yoktur; ses dosyaları "metin olarak ayrıştırılamaz."

  • MP3, WAV, OGG, FLAC
  • M4A, WebM
  • Ses kayıtları, podcast klipleri

Metin olarak yükle ve diğer yükleme seçenekleri

LibreChat'in dosya yüklemek için üç yolu vardır. Her biri farklı şekilde çalışır ve farklı durumlar için uygundur:

Hızlı karar rehberi:

DurumEn iyi seçenek
"Bu 5 sayfalık sözleşmeyi oku ve özetle"Metin Olarak Yükle
"50 adet PDF'im var, fiyatlandırmadan bahsedenleri bul"Dosya Arama (RAG)
"Bu ekran görüntüsünde ne var?" (görüntü modeli)Standart Yükleme
"Bu Python betiğini çalıştır" (kod yorumlayıcı)Standart Yükleme
"Bu kod dosyasını hatalar için incele"Metin Olarak Yükle
"Şirket belgelerimizde arama yap"Dosya Arama (RAG)

context yeteneği

Arka planda, Metin Olarak Yükle özelliği context yeteneği ile desteklenmektedir. Bu, özelliğin sohbet arayüzünüzde görünüp görünmeyeceğini kontrol eden şeydir.

context özelliği varsayılan olarak etkindir. Yalnızca yöneticiniz yetenekler listesini özelleştirdiyse ve yanlışlıkla bu özelliği çıkardıysa buna dokunmanız gerekir.

librechat.yaml
endpoints:
  agents:
    capabilities:
      - "context"  # This is what enables "Upload as Text"

Aynı context yeteneği, Ajan Dosya Bağlamı (bir ajanın sistem talimatlarına metin gömmek için Ajan Oluşturucu aracılığıyla dosya yükleme) özelliğine de güç sağlar. Aradaki fark, metnin nereye yerleştirildiğidir:

Metin Olarak YükleAjan Dosya Bağlamı
NeredeSohbet girişi (herhangi bir konuşma)Ajan Oluşturucu paneli
KapsamYalnızca mevcut konuşmaAjanın talimatlarında kalıcıdır
Kullanım durumuTek seferlik belge sorularıYerleşik bilgiye sahip özelleşmiş ajanlar oluşturma

Token sınırları ve kırpma

Bir dosya, modelin bağlam penceresine sığmayacak kadar uzun olduğunda, LibreChat çıkarılan metni sınırlar içinde kalacak şekilde kısaltır. Bu işlem otomatik olarak gerçekleşir; bu konuda endişelenmenize gerek yoktur ancak nasıl çalıştığını bilmekte fayda vardır.

librechat.yaml
fileConfig:
  fileTokenLimit: 100000  # Default: 100,000 tokens

Kısaltma, içeriğin kaybolması anlamına gelir

Dosyanız sınırı aşıyorsa, metin sonunda kesilir. Eksik yanıtlar alıyorsanız, bunun nedeni bu olabilir. fileTokenLimit değerini artırabilirsiniz, ancak daha büyük değerlerin mesaj başına daha fazla token kullandığını unutmayın; bu durum maliyeti artırır ve modelin kendi bağlam sınırına ulaşmasına neden olabilir.

Temel kurallar:

  • 100 bin token ≈ 300 sayfalık bir kitap (çoğu kullanım durumu için fazlasıyla yeterli)
  • Çok büyük dosyalarla çalışıyorsanız, her şeyi bağlama (context) doldurmak yerine yalnızca ilgili bölümleri getiren File Search (RAG) özelliğini kullanmayı değerlendirin.

İsteğe bağlı: OCR ile çıkarımı güçlendirme

Metin ayrıştırma, dijital olarak oluşturulmuş belgeler (Word'den kaydedilen PDF'ler, kod dosyaları, düz metinler) için gayet iyi çalışır. Ancak taranmış belgeler, sayfa fotoğrafları veya metin içeren görseller yüklüyorsanız, yerleşik ayrıştırıcı çok iyi sonuçlar vermeyecektir.

İşte bu noktada OCR devreye girer. Yapılandırıldığında LibreChat, bundan faydalanan dosya türleri için otomatik olarak OCR kullanır; bir kullanıcı olarak farklı bir şey yapmanıza gerek yoktur.


Dosya işleme yapılandırma referansı

Bu bölüm, hangi dosya türlerinin hangi yöntemle işleneceğini kontrol etmek isteyen yöneticiler içindir. Varsayılan ayarlar gayet iyi çalışır; yalnızca davranışı hassas bir şekilde ayarlamak istiyorsanız bu kısma müdahale etmeniz gerekir.


Sorun Giderme


Bu rehber nasıl?