Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack 🎉 Learn more
LibreChat

Dateien als Text hochladen

Ziehen Sie eine beliebige Datei in Ihren Chat und lassen Sie LibreChat sie lesen – keine Einrichtung erforderlich.

Dateien als Text hochladen

Wollten Sie schon immer ein PDF, eine Codedatei oder eine Tabelle an die KI übergeben und einfach sagen: "lies das"? Genau das macht Upload as Text.

Sie hängen eine Datei an, LibreChat extrahiert den Text daraus und der vollständige Inhalt wird direkt in Ihre Unterhaltung eingefügt. Die KI kann dann jedes Wort davon lesen – ohne Plugins, ohne Vektordatenbanken und ohne zusätzliche Dienste, die konfiguriert werden müssen. Es funktioniert sofort nach der Installation.

Keine Einrichtung erforderlich

„Upload as Text“ funktioniert sofort auf jeder LibreChat-Instanz. Es verwendet eine integrierte Textanalyse – Sie benötigen weder OCR, eine RAG-Pipeline noch einen externen Dienst, um loszulegen.


Verwendung

Klicken Sie auf das Anhang-Symbol

Klicken Sie in der Chat-Eingabeleiste auf das Büroklammer-Symbol (📎).

"Als Text hochladen" auswählen

Wählen Sie aus dem Dropdown-Menü Upload as Text aus. Dies weist LibreChat an, den Dateiinhalt zu lesen, anstatt ihn als reinen Anhang zu übermitteln.

Wählen Sie Ihre Datei

Wählen Sie die Datei von Ihrem Gerät aus. LibreChat extrahiert den Text und bettet ihn direkt in Ihre Nachricht ein.

Stellen Sie Ihre Frage

Geben Sie Ihren Prompt wie gewohnt ein. Die KI verfügt nun über den vollständigen Text Ihrer Datei im Kontext und kann auf jeden Teil davon verweisen.

Siehst du die Option nicht?

Falls „Upload as Text“ nicht erscheint, wurde die context-Funktion möglicherweise von Ihrem Administrator deaktiviert. Sie ist standardmäßig aktiviert – falls die Liste der Funktionen jedoch angepasst wurde, muss context explizit hinzugefügt werden. Siehe den Konfigurationsabschnitt weiter unten.


Was unter der Haube passiert

Wenn Sie eine Datei auf diese Weise hochladen, speichert LibreChat nicht einfach nur Rohdaten im Prompt. Sie durchläuft eine Verarbeitungspipeline, um sauberen, lesbaren Text zu extrahieren:

  1. MIME-Typ-Erkennung — LibreChat überprüft, welche Art von Datei Sie hochgeladen haben (PDF, Bild, Audio, Quellcode usw.), indem es deren MIME-Typ untersucht.
  2. Methodenauswahl — Basierend auf dem Dateityp und den verfügbaren Diensten wählt es die beste Extraktionsmethode unter Verwendung dieser Priorität:
PrioritätMethodeWann sie verwendet wird
1.OCRDatei ist ein Bild oder ein gescanntes Dokument und OCR ist konfiguriert
2.STT (Speech-to-Text)Datei ist Audio und STT ist konfiguriert
3.Text-ParsingDatei entspricht einem bekannten Text-MIME-Typ
4.FallbackNichts der oben genannten hat zugetroffen — versucht trotzdem Text-Parsing
  1. Token-Kürzung — Der extrahierte Text wird auf das fileTokenLimit (Standard: 100.000 Token) gekürzt, damit das Kontextfenster des Modells nicht überschritten wird.
  2. Prompt Injection — Der Text wird in den Gesprächskontext aufgenommen, direkt neben Ihrer Nachricht.

Welche Dateien werden unterstützt

Diese werden direkt geparst — sie sind bereits Text, daher ist keine Konvertierung erforderlich.

  • Klartext (.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS
  • Programmiersprachen — Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
  • Konfigurationsdateien — YAML, TOML, INI
  • Shell-Skripte, SQL-Dateien

Upload als Text vs. andere Upload-Optionen

LibreChat bietet drei Möglichkeiten, Dateien hochzuladen. Jede funktioniert anders und eignet sich für unterschiedliche Situationen:

Schnelle Entscheidungshilfe:

SituationBeste Option
"Lies diesen 5-seitigen Vertrag und fasse ihn zusammen"Als Text hochladen
"Ich habe 50 PDFs, finde die Stellen, an denen Preise erwähnt werden"Dateisuche (RAG)
"Was ist auf diesem Screenshot zu sehen?" (Vision-Modell)Standard-Upload
"Führe dieses Python-Skript aus" (Code-Interpreter)Standard-Upload
"Überprüfe diese Codedatei auf Fehler"Als Text hochladen
"Durchsuche unsere Firmendokumente"Dateisuche (RAG)

Die context Fähigkeit

Unter der Haube wird „Upload as Text“ durch die context capability betrieben. Dies steuert, ob die Funktion in Ihrer Chat-Benutzeroberfläche erscheint.

Die context-Funktion ist standardmäßig aktiviert. Sie müssen dies nur anpassen, wenn Ihr Administrator die Liste der Funktionen angepasst und sie versehentlich entfernt hat.

librechat.yaml
endpoints:
  agents:
    capabilities:
      - "context"  # This is what enables "Upload as Text"

Die gleiche context-Funktion unterstützt auch den Agent File Context (das Hochladen von Dateien über den Agent Builder, um Text in die Systemanweisungen eines Agenten einzubetten). Der Unterschied liegt darin, wo der Text landet:

Als Text hochladenAgent-Dateikontext
WoChat-Eingabe (beliebige Konversation)Agent Builder-Panel
GeltungsbereichNur aktuelle KonversationBleibt in den Anweisungen des Agenten bestehen
AnwendungsfallEinmalige DokumentenfragenErstellung spezialisierter Agenten mit integriertem Wissen

Token-Limits und Kürzung

Wenn eine Datei zu lang ist, um in das Kontextfenster des Modells zu passen, kürzt LibreChat den extrahierten Text, um innerhalb der Grenzen zu bleiben. Dies geschieht automatisch – Sie müssen sich keine Gedanken darüber machen, aber es ist gut zu wissen, wie es funktioniert.

librechat.yaml
fileConfig:
  fileTokenLimit: 100000  # Default: 100,000 tokens

Kürzung bedeutet verlorener Inhalt

Wenn Ihre Datei das Limit überschreitet, wird der Text am Ende abgeschnitten. Wenn Sie unvollständige Antworten erhalten, könnte dies der Grund sein. Sie können fileTokenLimit erhöhen, aber bedenken Sie, dass größere Werte mehr Token pro Nachricht verbrauchen – was die Kosten erhöht und dazu führen kann, dass das eigene Kontextlimit des Modells erreicht wird.

Faustregeln:

  • 100k Token ≈ ein 300-seitiges Buch (mehr als genug für die meisten Anwendungsfälle)
  • Wenn Sie mit sehr großen Dateien arbeiten, ziehen Sie stattdessen File Search (RAG) in Betracht – dies ruft nur die relevanten Abschnitte ab, anstatt alles in den Kontext zu stopfen.

Optional: Boosting der Extraktion mit OCR

Die Textanalyse funktioniert bei digital erstellten Dokumenten (PDFs, die aus Word gespeichert wurden, Codedateien, Klartext) einwandfrei. Wenn Sie jedoch gescannte Dokumente, Fotos von Seiten oder Bilder mit Text hochladen, wird der integrierte Parser keine optimalen Ergebnisse liefern.

Hier kommt OCR ins Spiel. Wenn es konfiguriert ist, verwendet LibreChat automatisch OCR für Dateitypen, die davon profitieren – als Benutzer müssen Sie nichts anders machen.


Referenz zur Konfiguration der Dateiverarbeitung

Dieser Abschnitt ist für Administratoren gedacht, die steuern möchten, welche Dateitypen mit welcher Methode verarbeitet werden. Die Standardeinstellungen funktionieren gut – Sie müssen dies nur anpassen, wenn Sie das Verhalten feinabstimmen möchten.


Fehlerbehebung


Wie finden Sie diese Anleitung?