Sleep elk bestand in je chat en laat LibreChat het lezen — geen configuratie nodig.

Bestanden uploaden als tekst

Heb je er ooit van gedroomd om een PDF, een codebestand of een spreadsheet aan de AI te geven en simpelweg te zeggen "lees dit"? Dat is precies wat Upload as Text doet.

Je voegt een bestand toe, LibreChat extraheert de tekst eruit en de volledige inhoud wordt direct in je gesprek geplakt. De AI kan vervolgens elk woord ervan lezen — geen plugins, geen vectordatabases, geen extra services om te configureren. Het werkt direct uit de doos.

Geen configuratie vereist

Upload as Text werkt onmiddellijk op elk LibreChat-exemplaar. Het maakt gebruik van ingebouwde tekstverwerking — je hebt geen OCR, RAG-pijplijn of externe service nodig om aan de slag te gaan.

Hoe het te gebruiken

Klik op het bijlage-icoon

Klik in de chat-invoerbalk op het paperclip (📎) icoon.

Kies "Upload as Text"

Selecteer vanuit het dropdownmenu Upload as Text. Dit vertelt LibreChat om de bestandsinhoud te lezen in plaats van deze als een onbewerkte bijlage door te sturen.

Kies uw bestand

Selecteer het bestand vanaf uw apparaat. LibreChat zal de tekst extraheren en deze direct in uw bericht insluiten.

Stel je vraag

Typ je prompt zoals gewoonlijk. De AI heeft nu de volledige tekst van je bestand in de context en kan naar elk deel ervan verwijzen.

Zie je de optie niet?

Als "Upload as Text" niet verschijnt, is de context capability mogelijk uitgeschakeld door je beheerder. Deze staat standaard aan, maar als de lijst met capabilities is aangepast, moet context expliciet worden toegevoegd. Zie de configuration section hieronder.

Wat er achter de schermen gebeurt

Wanneer je op deze manier een bestand uploadt, dumpt LibreChat niet zomaar onbewerkte bytes in de prompt. Het doorloopt een verwerkingspijplijn om schone, leesbare tekst te extraheren:

MIME type detectie — LibreChat controleert welk type bestand je hebt geüpload (PDF, afbeelding, audio, broncode, enz.) door het MIME type te inspecteren.
Methodeselectie — Op basis van het bestandstype en de beschikbare services, kiest het de beste extractiemethode met behulp van deze prioriteit:

Prioriteit	Methode	Wanneer het wordt gebruikt
1e	OCR	Bestand is een afbeelding of gescand document, en OCR is geconfigureerd
2e	STT (Speech-to-Text)	Bestand is audio, en STT is geconfigureerd
3e	Tekstparsing	Bestand komt overeen met een bekend tekst-MIME-type
4e	Fallback	Niets van het bovenstaande kwam overeen — probeert alsnog tekstparsing

Een .pdf op een instantie met OCR geconfigureerd: → OCR wordt geactiveerd. Geweldig voor gescande documenten en complexe lay-outs.

Een .pdf op een standaard instantie (geen OCR): → Tekstverwerking handelt dit af. Werkt goed voor digitaal gemaakte PDF's.

Een .py Python-bestand: → Direct naar tekstverwerking. Broncode is al tekst — geen conversie nodig.

Een .mp3 op een instantie waar STT is geconfigureerd: → Speech-to-Text transcribeert het naar tekst voor het gesprek.

Een .png screenshot zonder geconfigureerde OCR: → Valt terug op tekstverwerking (beperkte resultaten — overweeg om OCR in te stellen voor afbeeldingen).

Token-truncatie — De geëxtraheerde tekst wordt ingekort tot de fileTokenLimit (standaard: 100.000 tokens), zodat deze het contextvenster van het model niet overschrijdt.
Prompt injection — De tekst wordt opgenomen in de gesprekscontext, direct naast je bericht.

Welke bestanden worden ondersteund

Deze worden direct geparseerd — ze zijn al tekst, dus conversie is niet nodig.

Platte tekst (.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS
Programmeertalen — Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
Configuratiebestanden — YAML, TOML, INI
Shell-scripts, SQL-bestanden

Tekstparsing handelt deze standaard af. Als OCR is geconfigureerd, neemt dit het over voor een betere nauwkeurigheid bij complexe lay-outs.

PDF — digitaal en gescand (gescande PDF's profiteren van OCR)
Word — .docx, .doc
PowerPoint — .pptx, .ppt
Excel — .xlsx, .xls
EPUB-boeken

Afbeeldingen vereisen OCR om bruikbare tekst te produceren. Zonder dit zullen de resultaten matig zijn.

JPEG, PNG, GIF, WebP
HEIC, HEIF (Apple-formaten)
Screenshots, foto's van documenten, gescande pagina's

Audiobestanden vereisen dat STT is geconfigureerd. Er is geen fallback — audio kan niet worden "geparseerd als tekst."

MP3, WAV, OGG, FLAC
M4A, WebM
Spraakopnames, podcastfragmenten

Uploaden als tekst versus andere uploadopties

LibreChat heeft drie manieren om bestanden te uploaden. Elke manier werkt anders en is geschikt voor verschillende situaties:

Uploaden als tekst

Extraheert de volledige bestandsinhoud en plaatst deze in het gesprek. Het beste voor kleinere bestanden waarvan je wilt dat de AI alles leest — contracten, codebestanden, artikelen. Werkt met alle modellen, geen extra services nodig.

Upload voor Bestandszoekopdracht (RAG)

Indexeert het bestand in een vector-database en haalt alleen de relevante fragmenten op wanneer je een vraag stelt. Beter voor grote bestanden of verzamelingen bestanden waarbij alles in de context plaatsen tokens zou verspillen. Vereist de RAG API.

Standaard upload

Stuurt het bestand rechtstreeks naar het model — wordt gebruikt voor vision-modellen die afbeeldingen analyseren, of voor de code-interpreter die scripts uitvoert. Er vindt geen tekstextractie plaats.

Snelkeuzegids:

Situatie	Beste optie
"Lees dit contract van 5 pagina's en vat het samen"	Upload als tekst
"Ik heb 50 pdf's, zoek naar vermeldingen van prijzen"	Bestandszoekopdracht (RAG)
"Wat staat er op deze schermafbeelding?" (vision-model)	Standaard upload
"Voer dit Python-script uit" (code-interpreter)	Standaard upload
"Controleer dit codebestand op bugs"	Upload als tekst
"Doorzoek onze bedrijfsdocumenten"	Bestandszoekopdracht (RAG)

De `context` capability

Onder de motorkap wordt Upload as Text aangedreven door de context capability. Dit is wat bepaalt of de functie verschijnt in je chat-UI.

De context capability is standaard ingeschakeld. Je hoeft dit alleen aan te passen als je beheerder de lijst met capabilities heeft aangepast en deze per ongeluk heeft weggelaten.

librechat.yaml

endpoints:
  agents:
    capabilities:
      - "context"  # This is what enables "Upload as Text"

Dezelfde context functionaliteit drijft ook Agent File Context aan (het uploaden van bestanden via de Agent Builder om tekst in de systeemprompts van een agent in te sluiten). Het verschil is waar de tekst terechtkomt:

	Upload as Text	Agent File Context
Waar	Chat-invoer (elke conversatie)	Agent Builder-paneel
Bereik	Alleen huidige conversatie	Blijft behouden in de instructies van de agent
Gebruiksscenario	Eenmalige documentvragen	Het bouwen van gespecialiseerde agents met ingebouwde kennis

Tokenlimieten en truncatie

Wanneer een bestand te lang is om in het contextvenster van het model te passen, kapt LibreChat de geëxtraheerde tekst af om binnen de limieten te blijven. Dit gebeurt automatisch — je hoeft je hier geen zorgen over te maken, maar het is goed om te weten hoe het werkt.

librechat.yaml

fileConfig:
  fileTokenLimit: 100000  # Default: 100,000 tokens

Truncatie betekent verloren inhoud

Als je bestand de limiet overschrijdt, wordt de tekst aan het einde afgekapt. Als je onvolledige antwoorden krijgt, kan dit de reden zijn. Je kunt fileTokenLimit verhogen, maar houd er rekening mee dat hogere waarden meer tokens per bericht verbruiken — wat de kosten verhoogt en de eigen contextlimiet van het model kan overschrijden.

Vuistregels:

100k tokens ≈ een boek van 300 pagina's (ruim voldoende voor de meeste gebruiksdoeleinden)
Als je met zeer grote bestanden werkt, overweeg dan File Search (RAG) — dit haalt alleen de relevante secties op in plaats van alles in de context te proppen.

Optioneel: extractie verbeteren met OCR

Tekstverwerking werkt prima voor digitaal gemaakte documenten (PDF's opgeslagen vanuit Word, codebestanden, platte tekst). Maar als je ingescande documenten, foto's van pagina's of afbeeldingen met tekst uploadt, zal de ingebouwde parser geen geweldige resultaten opleveren.

Dat is waar OCR van pas komt. Wanneer dit is geconfigureerd, gebruikt LibreChat automatisch OCR voor bestandstypen die hiervan profiteren — als gebruiker hoef je niets anders te doen.

Referentie voor configuratie van bestandsafhandeling

Deze sectie is bedoeld voor beheerders die willen bepalen welke bestandstypen door welke methode worden verwerkt. De standaardinstellingen werken goed — je hoeft dit alleen aan te passen als je het gedrag wilt verfijnen.

Probleemoplossing

OCR voor documenten — Stel optische tekenherkenning in voor afbeeldingen en scans
RAG API (Chat met bestanden) — Semantisch zoeken in grote documentverzamelingen
Agents — File Context — Sluit bestandsinhoud in bij de systeeminstructies van een agent
File Config reference — Volledig YAML-schema voor bestandsafhandeling

Bestanden uploaden als tekst

Uploaden als tekst

Upload voor Bestandszoekopdracht (RAG)

Standaard upload

Hoe je je beheerder vraagt om OCR in te stellen

Hoe je je beheerder vraagt om STT in te stellen (voor audiobestanden)

Volledig fileConfig voorbeeld

Optie 'Uploaden als tekst' verschijnt niet

Bestandsinhoud ziet er verkeerd uit of is grotendeels leeg

De AI lijkt een deel van mijn bestand te missen

Afbeeldingen worden geüpload, maar de AI kan de tekst erin niet lezen

Op deze pagina