Dateien als Text hochladen
Ziehen Sie eine beliebige Datei in Ihren Chat und lassen Sie LibreChat sie lesen – keine Einrichtung erforderlich.
Dateien als Text hochladen
Wollten Sie schon immer ein PDF, eine Codedatei oder eine Tabelle an die KI übergeben und einfach sagen: "lies das"? Genau das macht Upload as Text.
Sie hängen eine Datei an, LibreChat extrahiert den Text daraus und der vollständige Inhalt wird direkt in Ihre Unterhaltung eingefügt. Die KI kann dann jedes Wort davon lesen – ohne Plugins, ohne Vektordatenbanken und ohne zusätzliche Dienste, die konfiguriert werden müssen. Es funktioniert sofort nach der Installation.
Keine Einrichtung erforderlich
„Upload as Text“ funktioniert sofort auf jeder LibreChat-Instanz. Es verwendet eine integrierte Textanalyse – Sie benötigen weder OCR, eine RAG-Pipeline noch einen externen Dienst, um loszulegen.
Verwendung
Klicken Sie auf das Anhang-Symbol
Klicken Sie in der Chat-Eingabeleiste auf das Büroklammer-Symbol (📎).
"Als Text hochladen" auswählen
Wählen Sie aus dem Dropdown-Menü Upload as Text aus. Dies weist LibreChat an, den Dateiinhalt zu lesen, anstatt ihn als reinen Anhang zu übermitteln.
Wählen Sie Ihre Datei
Wählen Sie die Datei von Ihrem Gerät aus. LibreChat extrahiert den Text und bettet ihn direkt in Ihre Nachricht ein.
Stellen Sie Ihre Frage
Geben Sie Ihren Prompt wie gewohnt ein. Die KI verfügt nun über den vollständigen Text Ihrer Datei im Kontext und kann auf jeden Teil davon verweisen.
Siehst du die Option nicht?
Falls „Upload as Text“ nicht erscheint, wurde die context-Funktion möglicherweise von Ihrem Administrator deaktiviert. Sie ist standardmäßig aktiviert – falls die Liste der Funktionen jedoch angepasst wurde, muss context explizit hinzugefügt werden. Siehe den Konfigurationsabschnitt weiter unten.
Was unter der Haube passiert
Wenn Sie eine Datei auf diese Weise hochladen, speichert LibreChat nicht einfach nur Rohdaten im Prompt. Sie durchläuft eine Verarbeitungspipeline, um sauberen, lesbaren Text zu extrahieren:
- MIME-Typ-Erkennung — LibreChat überprüft, welche Art von Datei Sie hochgeladen haben (PDF, Bild, Audio, Quellcode usw.), indem es deren MIME-Typ untersucht.
- Methodenauswahl — Basierend auf dem Dateityp und den verfügbaren Diensten wählt es die beste Extraktionsmethode unter Verwendung dieser Priorität:
| Priorität | Methode | Wann sie verwendet wird |
|---|---|---|
| 1. | OCR | Datei ist ein Bild oder ein gescanntes Dokument und OCR ist konfiguriert |
| 2. | STT (Speech-to-Text) | Datei ist Audio und STT ist konfiguriert |
| 3. | Text-Parsing | Datei entspricht einem bekannten Text-MIME-Typ |
| 4. | Fallback | Nichts der oben genannten hat zugetroffen — versucht trotzdem Text-Parsing |
- Token-Kürzung — Der extrahierte Text wird auf das
fileTokenLimit(Standard: 100.000 Token) gekürzt, damit das Kontextfenster des Modells nicht überschritten wird. - Prompt Injection — Der Text wird in den Gesprächskontext aufgenommen, direkt neben Ihrer Nachricht.
Welche Dateien werden unterstützt
Diese werden direkt geparst — sie sind bereits Text, daher ist keine Konvertierung erforderlich.
- Klartext (
.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS - Programmiersprachen — Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
- Konfigurationsdateien — YAML, TOML, INI
- Shell-Skripte, SQL-Dateien
Upload als Text vs. andere Upload-Optionen
LibreChat bietet drei Möglichkeiten, Dateien hochzuladen. Jede funktioniert anders und eignet sich für unterschiedliche Situationen:
Als Text hochladen
Extrahiert den vollständigen Dateiinhalt und fügt ihn in die Konversation ein. Am besten geeignet für kleinere Dateien, bei denen die KI alles lesen soll — Verträge, Codedateien, Artikel. Funktioniert mit allen Modellen, es sind keine zusätzlichen Dienste erforderlich.
Upload für Dateisuche (RAG)
Indiziert die Datei in einer Vektordatenbank und ruft nur die relevanten Abschnitte ab, wenn Sie eine Frage stellen. Besser geeignet für große Dateien oder Dateisammlungen, bei denen das vollständige Einfügen in den Kontext Token verschwenden würde. Erfordert die RAG API.
Standard-Upload
Übergibt die Datei direkt an das Modell – wird für Vision-Modelle zur Bildanalyse oder für den Code-Interpreter zum Ausführen von Skripten verwendet. Es findet keine Textextraktion statt.
Schnelle Entscheidungshilfe:
| Situation | Beste Option |
|---|---|
| "Lies diesen 5-seitigen Vertrag und fasse ihn zusammen" | Als Text hochladen |
| "Ich habe 50 PDFs, finde die Stellen, an denen Preise erwähnt werden" | Dateisuche (RAG) |
| "Was ist auf diesem Screenshot zu sehen?" (Vision-Modell) | Standard-Upload |
| "Führe dieses Python-Skript aus" (Code-Interpreter) | Standard-Upload |
| "Überprüfe diese Codedatei auf Fehler" | Als Text hochladen |
| "Durchsuche unsere Firmendokumente" | Dateisuche (RAG) |
Die context Fähigkeit
Unter der Haube wird „Upload as Text“ durch die context capability betrieben. Dies steuert, ob die Funktion in Ihrer Chat-Benutzeroberfläche erscheint.
Die context-Funktion ist standardmäßig aktiviert. Sie müssen dies nur anpassen, wenn Ihr Administrator die Liste der Funktionen angepasst und sie versehentlich entfernt hat.
Die gleiche context-Funktion unterstützt auch den Agent File Context (das Hochladen von Dateien über den Agent Builder, um Text in die Systemanweisungen eines Agenten einzubetten). Der Unterschied liegt darin, wo der Text landet:
| Als Text hochladen | Agent-Dateikontext | |
|---|---|---|
| Wo | Chat-Eingabe (beliebige Konversation) | Agent Builder-Panel |
| Geltungsbereich | Nur aktuelle Konversation | Bleibt in den Anweisungen des Agenten bestehen |
| Anwendungsfall | Einmalige Dokumentenfragen | Erstellung spezialisierter Agenten mit integriertem Wissen |
Token-Limits und Kürzung
Wenn eine Datei zu lang ist, um in das Kontextfenster des Modells zu passen, kürzt LibreChat den extrahierten Text, um innerhalb der Grenzen zu bleiben. Dies geschieht automatisch – Sie müssen sich keine Gedanken darüber machen, aber es ist gut zu wissen, wie es funktioniert.
Kürzung bedeutet verlorener Inhalt
Wenn Ihre Datei das Limit überschreitet, wird der Text am Ende abgeschnitten. Wenn Sie unvollständige Antworten erhalten, könnte dies der Grund sein. Sie können fileTokenLimit erhöhen, aber bedenken Sie, dass größere Werte mehr Token pro Nachricht verbrauchen – was die Kosten erhöht und dazu führen kann, dass das eigene Kontextlimit des Modells erreicht wird.
Faustregeln:
- 100k Token ≈ ein 300-seitiges Buch (mehr als genug für die meisten Anwendungsfälle)
- Wenn Sie mit sehr großen Dateien arbeiten, ziehen Sie stattdessen File Search (RAG) in Betracht – dies ruft nur die relevanten Abschnitte ab, anstatt alles in den Kontext zu stopfen.
Optional: Boosting der Extraktion mit OCR
Die Textanalyse funktioniert bei digital erstellten Dokumenten (PDFs, die aus Word gespeichert wurden, Codedateien, Klartext) einwandfrei. Wenn Sie jedoch gescannte Dokumente, Fotos von Seiten oder Bilder mit Text hochladen, wird der integrierte Parser keine optimalen Ergebnisse liefern.
Hier kommt OCR ins Spiel. Wenn es konfiguriert ist, verwendet LibreChat automatisch OCR für Dateitypen, die davon profitieren – als Benutzer müssen Sie nichts anders machen.
Referenz zur Konfiguration der Dateiverarbeitung
Dieser Abschnitt ist für Administratoren gedacht, die steuern möchten, welche Dateitypen mit welcher Methode verarbeitet werden. Die Standardeinstellungen funktionieren gut – Sie müssen dies nur anpassen, wenn Sie das Verhalten feinabstimmen möchten.
Fehlerbehebung
Verwandt
- OCR für Dokumente — Richten Sie die optische Zeichenerkennung für Bilder und Scans ein
- RAG API (Chat with Files) — Semantische Suche über große Dokumentensammlungen
- Agents — File Context — Dateiinhalte in die Systemanweisungen eines Agents einbetten
- File Config Referenz — Vollständiges YAML-Schema für die Dateiverarbeitung
Wie finden Sie diese Anleitung?