Dosyaları Metin Olarak Yükle
Herhangi bir dosyayı sohbetinize sürükleyip bırakın ve LibreChat'in onu okumasını sağlayın; hiçbir kurulum gerekmez.
Dosyaları Metin Olarak Yükle
Hiç bir PDF'i, kod dosyasını veya elektronik tabloyu yapay zekaya verip sadece "bunu oku" demek istediniz mi? Upload as Text tam olarak bunu yapar.
Bir dosya eklediğinizde LibreChat içindeki metni çıkarır ve tüm içerik doğrudan konuşmanıza yapıştırılır. Yapay zeka, herhangi bir eklentiye, vektör veritabanına veya yapılandırılacak ekstra hizmetlere ihtiyaç duymadan metindeki her kelimeyi okuyabilir. Kutudan çıktığı gibi çalışır.
Kurulum gerektirmez
Upload as Text, herhangi bir LibreChat örneğinde anında çalışır. Yerleşik metin ayrıştırma özelliğini kullanır; başlamak için OCR, RAG hattı veya herhangi bir harici hizmete ihtiyacınız yoktur.
Nasıl kullanılır
Ek simgesine tıklayın
Sohbet giriş çubuğundaki ataç (📎) simgesine tıklayın.
"Metin Olarak Yükle"yi seçin
Açılır menüden Upload as Text seçeneğini belirleyin. Bu, LibreChat'e dosya içeriğini ham bir ek olarak iletmek yerine okuması talimatını verir.
Dosyanızı seçin
Cihazınızdan dosyayı seçin. LibreChat metni çıkaracak ve doğrudan mesajınızın içine gömecektir.
Sorunuzu sorun
İsteminizi her zamanki gibi yazın. Yapay zeka artık dosyanızın tam metnine bağlam içinde sahiptir ve dosyanın herhangi bir kısmına referans verebilir.
Seçeneği göremiyor musunuz?
"Upload as Text" görünmüyorsa, context yeteneği yöneticiniz tarafından devre dışı bırakılmış olabilir. Bu özellik varsayılan olarak açıktır; ancak yetenekler listesi özelleştirildiyse, context öğesinin açıkça dahil edilmesi gerekir. Aşağıdaki yapılandırma bölümüne bakın.
Arka planda neler oluyor
Bir dosyayı bu şekilde yüklediğinizde, LibreChat ham baytları doğrudan isteme (prompt) dökmez. Temiz ve okunabilir metni çıkarmak için bir işleme hattı üzerinden çalıştırır:
- MIME türü algılama — LibreChat, yüklediğiniz dosyanın türünü (PDF, görsel, ses, kaynak kodu vb.) MIME türünü inceleyerek kontrol eder.
- Yöntem seçimi — Dosya türüne ve hangi hizmetlerin kullanılabilir olduğuna bağlı olarak, aşağıdaki öncelik sırasını kullanarak en iyi ayıklama yöntemini seçer:
| Öncelik | Yöntem | Ne zaman kullanılır |
|---|---|---|
| 1. | OCR | Dosya bir resim veya taranmış belgeyse ve OCR yapılandırılmışsa |
| 2. | STT (Konuşmadan Metne) | Dosya ses dosyasıysa ve STT yapılandırılmışsa |
| 3. | Metin ayrıştırma | Dosya bilinen bir metin MIME türüyle eşleşiyorsa |
| 4. | Yedek (Fallback) | Yukarıdakilerden hiçbiri eşleşmediyse — yine de metin ayrıştırmayı dener |
OCR yapılandırılmış bir örnek üzerinde bir .pdf dosyası:
→ OCR devreye girer. Taranmış belgeler ve karmaşık düzenler için harikadır.
Varsayılan bir örnekte (OCR olmadan) bir .pdf dosyası:
→ Metin ayrıştırma işlemi bunu halleder. Dijital olarak oluşturulmuş PDF'ler için iyi çalışır.
Bir .py Python dosyası:
→ Doğrudan metin ayrıştırmaya. Kaynak kod zaten metindir — dönüştürmeye gerek yoktur.
STT yapılandırılmış bir örnekte bir .mp3 dosyası:
→ Speech-to-Text, bunu konuşma için metne dönüştürür.
OCR yapılandırılmamış bir .png ekran görüntüsü:
→ Metin ayrıştırmaya geri döner (sınırlı sonuçlar — görüntüler için OCR kurulumu yapmayı düşünün).
- Token kırpma — Çıkarılan metin, modelin bağlam penceresini aşmaması için
fileTokenLimit(varsayılan: 100.000 token) değerine göre kırpılır. - Prompt injection — Metin, mesajınızla birlikte doğrudan konuşma bağlamına dahil edilir.
Hangi dosyalar destekleniyor
Bunlar doğrudan ayrıştırılır — zaten metin oldukları için herhangi bir dönüştürmeye gerek yoktur.
- Düz metin (
.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS - Programlama dilleri — Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
- Yapılandırma dosyaları — YAML, TOML, INI
- Shell betikleri, SQL dosyaları
Metin ayrıştırma (text parsing) bunları kutudan çıktığı haliyle işler. Eğer OCR yapılandırılmışsa, karmaşık düzenlerde daha iyi doğruluk için kontrolü devralır.
- PDF — dijital ve taranmış (taranmış PDF'ler OCR'dan yararlanır)
- Word —
.docx,.doc - PowerPoint —
.pptx,.ppt - Excel —
.xlsx,.xls - EPUB kitapları
Görüntülerin yararlı metinler üretmesi için OCR gereklidir. Aksi takdirde sonuçlar yetersiz olacaktır.
- JPEG, PNG, GIF, WebP
- HEIC, HEIF (Apple formatları)
- Ekran görüntüleri, belge fotoğrafları, taranmış sayfalar
Ses dosyaları için STT yapılandırılmış olmalıdır. Bir geri dönüş (fallback) mekanizması yoktur; ses dosyaları "metin olarak ayrıştırılamaz."
- MP3, WAV, OGG, FLAC
- M4A, WebM
- Ses kayıtları, podcast klipleri
Metin olarak yükle ve diğer yükleme seçenekleri
LibreChat'in dosya yüklemek için üç yolu vardır. Her biri farklı şekilde çalışır ve farklı durumlar için uygundur:
Metin Olarak Yükle
Dosyanın tüm içeriğini çıkarır ve konuşmaya bırakır. Sözleşmeler, kod dosyaları, makaleler gibi AI'nın her şeyi okumasını istediğiniz daha küçük dosyalar için en iyisidir. Tüm modellerle çalışır, ekstra hizmet gerektirmez.
Dosya Arama (RAG) için Yükleme
Dosyayı bir vektör veritabanında indeksler ve bir soru sorduğunuzda yalnızca ilgili parçaları getirir. Her şeyi bağlama (context) dökmenin token israfına yol açacağı büyük dosyalar veya dosya koleksiyonları için daha iyidir. RAG API gerektirir.
Standart Yükleme
Dosyayı doğrudan modele iletir; görüntüleri analiz eden vision modelleri veya betikleri çalıştıran code interpreter için kullanılır. Metin çıkarma işlemi gerçekleşmez.
Hızlı karar rehberi:
| Durum | En iyi seçenek |
|---|---|
| "Bu 5 sayfalık sözleşmeyi oku ve özetle" | Metin Olarak Yükle |
| "50 adet PDF'im var, fiyatlandırmadan bahsedenleri bul" | Dosya Arama (RAG) |
| "Bu ekran görüntüsünde ne var?" (görüntü modeli) | Standart Yükleme |
| "Bu Python betiğini çalıştır" (kod yorumlayıcı) | Standart Yükleme |
| "Bu kod dosyasını hatalar için incele" | Metin Olarak Yükle |
| "Şirket belgelerimizde arama yap" | Dosya Arama (RAG) |
context yeteneği
Arka planda, Metin Olarak Yükle özelliği context yeteneği ile desteklenmektedir. Bu, özelliğin sohbet arayüzünüzde görünüp görünmeyeceğini kontrol eden şeydir.
context özelliği varsayılan olarak etkindir. Yalnızca yöneticiniz yetenekler listesini özelleştirdiyse ve yanlışlıkla bu özelliği çıkardıysa buna dokunmanız gerekir.
endpoints:
agents:
capabilities:
- "context" # This is what enables "Upload as Text"Aynı context yeteneği, Ajan Dosya Bağlamı (bir ajanın sistem talimatlarına metin gömmek için Ajan Oluşturucu aracılığıyla dosya yükleme) özelliğine de güç sağlar. Aradaki fark, metnin nereye yerleştirildiğidir:
| Metin Olarak Yükle | Ajan Dosya Bağlamı | |
|---|---|---|
| Nerede | Sohbet girişi (herhangi bir konuşma) | Ajan Oluşturucu paneli |
| Kapsam | Yalnızca mevcut konuşma | Ajanın talimatlarında kalıcıdır |
| Kullanım durumu | Tek seferlik belge soruları | Yerleşik bilgiye sahip özelleşmiş ajanlar oluşturma |
Token sınırları ve kırpma
Bir dosya, modelin bağlam penceresine sığmayacak kadar uzun olduğunda, LibreChat çıkarılan metni sınırlar içinde kalacak şekilde kısaltır. Bu işlem otomatik olarak gerçekleşir; bu konuda endişelenmenize gerek yoktur ancak nasıl çalıştığını bilmekte fayda vardır.
fileConfig:
fileTokenLimit: 100000 # Default: 100,000 tokensKısaltma, içeriğin kaybolması anlamına gelir
Dosyanız sınırı aşıyorsa, metin sonunda kesilir. Eksik yanıtlar alıyorsanız, bunun nedeni bu olabilir. fileTokenLimit değerini artırabilirsiniz, ancak daha büyük değerlerin mesaj başına daha fazla token kullandığını unutmayın; bu durum maliyeti artırır ve modelin kendi bağlam sınırına ulaşmasına neden olabilir.
Temel kurallar:
- 100 bin token ≈ 300 sayfalık bir kitap (çoğu kullanım durumu için fazlasıyla yeterli)
- Çok büyük dosyalarla çalışıyorsanız, her şeyi bağlama (context) doldurmak yerine yalnızca ilgili bölümleri getiren File Search (RAG) özelliğini kullanmayı değerlendirin.
İsteğe bağlı: OCR ile çıkarımı güçlendirme
Metin ayrıştırma, dijital olarak oluşturulmuş belgeler (Word'den kaydedilen PDF'ler, kod dosyaları, düz metinler) için gayet iyi çalışır. Ancak taranmış belgeler, sayfa fotoğrafları veya metin içeren görseller yüklüyorsanız, yerleşik ayrıştırıcı çok iyi sonuçlar vermeyecektir.
İşte bu noktada OCR devreye girer. Yapılandırıldığında LibreChat, bundan faydalanan dosya türleri için otomatik olarak OCR kullanır; bir kullanıcı olarak farklı bir şey yapmanıza gerek yoktur.
Dosya işleme yapılandırma referansı
Bu bölüm, hangi dosya türlerinin hangi yöntemle işleneceğini kontrol etmek isteyen yöneticiler içindir. Varsayılan ayarlar gayet iyi çalışır; yalnızca davranışı hassas bir şekilde ayarlamak istiyorsanız bu kısma müdahale etmeniz gerekir.
Sorun Giderme
İlgili
- OCR for Documents — Görseller ve taramalar için optik karakter tanımayı (OCR) ayarlayın
- RAG API (Dosyalarla Sohbet) — Büyük belge koleksiyonları üzerinde anlamsal arama
- Agents — File Context — Dosya içeriğini bir ajanın sistem talimatlarına gömün
- File Config referansı — Dosya işleme için tam YAML şeması
Bu rehber nasıl?
RAG API (Dosyalarla Sohbet)
Langchain ve FastAPI kullanarak belge indeksleme ve getirme işlemleri için Retrieval-Augmented Generation (RAG) API. Bu API, kullanıcı tarafından yüklenen dosyalara dayalı bağlama duyarlı yanıtlar sağlamak için LibreChat ile entegre olur.
Belgeler için OCR
LibreChat'in dosya yükleme özelliklerinde metin çıkarımını geliştirmek için Optik Karakter Tanıma (OCR) özelliğini nasıl yapılandıracağınızı öğrenin.