Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack πŸŽ‰ Learn more
LibreChat

Bestanden uploaden als tekst

Sleep elk bestand in je chat en laat LibreChat het lezen β€” geen configuratie nodig.

Bestanden uploaden als tekst

Heb je er ooit van gedroomd om een PDF, een codebestand of een spreadsheet aan de AI te geven en simpelweg te zeggen "lees dit"? Dat is precies wat Upload as Text doet.

Je voegt een bestand toe, LibreChat extraheert de tekst eruit en de volledige inhoud wordt direct in je gesprek geplakt. De AI kan vervolgens elk woord ervan lezen β€” geen plugins, geen vectordatabases, geen extra services om te configureren. Het werkt direct uit de doos.

Geen configuratie vereist

Upload as Text werkt onmiddellijk op elk LibreChat-exemplaar. Het maakt gebruik van ingebouwde tekstverwerking β€” je hebt geen OCR, RAG-pijplijn of externe service nodig om aan de slag te gaan.


Hoe het te gebruiken

Klik op het bijlage-icoon

Klik in de chat-invoerbalk op het paperclip (πŸ“Ž) icoon.

Kies "Upload as Text"

Selecteer vanuit het dropdownmenu Upload as Text. Dit vertelt LibreChat om de bestandsinhoud te lezen in plaats van deze als een onbewerkte bijlage door te sturen.

Kies uw bestand

Selecteer het bestand vanaf uw apparaat. LibreChat zal de tekst extraheren en deze direct in uw bericht insluiten.

Stel je vraag

Typ je prompt zoals gewoonlijk. De AI heeft nu de volledige tekst van je bestand in de context en kan naar elk deel ervan verwijzen.

Zie je de optie niet?

Als "Upload as Text" niet verschijnt, is de context capability mogelijk uitgeschakeld door je beheerder. Deze staat standaard aan, maar als de lijst met capabilities is aangepast, moet context expliciet worden toegevoegd. Zie de configuration section hieronder.


Wat er achter de schermen gebeurt

Wanneer je op deze manier een bestand uploadt, dumpt LibreChat niet zomaar onbewerkte bytes in de prompt. Het doorloopt een verwerkingspijplijn om schone, leesbare tekst te extraheren:

  1. MIME type detectie β€” LibreChat controleert welk type bestand je hebt geΓΌpload (PDF, afbeelding, audio, broncode, enz.) door het MIME type te inspecteren.
  2. Methodeselectie β€” Op basis van het bestandstype en de beschikbare services, kiest het de beste extractiemethode met behulp van deze prioriteit:
PrioriteitMethodeWanneer het wordt gebruikt
1eOCRBestand is een afbeelding of gescand document, en OCR is geconfigureerd
2eSTT (Speech-to-Text)Bestand is audio, en STT is geconfigureerd
3eTekstparsingBestand komt overeen met een bekend tekst-MIME-type
4eFallbackNiets van het bovenstaande kwam overeen β€” probeert alsnog tekstparsing

Een .pdf op een instantie met OCR geconfigureerd: β†’ OCR wordt geactiveerd. Geweldig voor gescande documenten en complexe lay-outs.

Een .pdf op een standaard instantie (geen OCR): β†’ Tekstverwerking handelt dit af. Werkt goed voor digitaal gemaakte PDF's.

Een .py Python-bestand: β†’ Direct naar tekstverwerking. Broncode is al tekst β€” geen conversie nodig.

Een .mp3 op een instantie waar STT is geconfigureerd: β†’ Speech-to-Text transcribeert het naar tekst voor het gesprek.

Een .png screenshot zonder geconfigureerde OCR: β†’ Valt terug op tekstverwerking (beperkte resultaten β€” overweeg om OCR in te stellen voor afbeeldingen).

  1. Token-truncatie β€” De geΓ«xtraheerde tekst wordt ingekort tot de fileTokenLimit (standaard: 100.000 tokens), zodat deze het contextvenster van het model niet overschrijdt.
  2. Prompt injection β€” De tekst wordt opgenomen in de gesprekscontext, direct naast je bericht.

Welke bestanden worden ondersteund

Deze worden direct geparseerd β€” ze zijn al tekst, dus conversie is niet nodig.

  • Platte tekst (.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS
  • Programmeertalen β€” Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
  • Configuratiebestanden β€” YAML, TOML, INI
  • Shell-scripts, SQL-bestanden

Tekstparsing handelt deze standaard af. Als OCR is geconfigureerd, neemt dit het over voor een betere nauwkeurigheid bij complexe lay-outs.

  • PDF β€” digitaal en gescand (gescande PDF's profiteren van OCR)
  • Word β€” .docx, .doc
  • PowerPoint β€” .pptx, .ppt
  • Excel β€” .xlsx, .xls
  • EPUB-boeken

Afbeeldingen vereisen OCR om bruikbare tekst te produceren. Zonder dit zullen de resultaten matig zijn.

  • JPEG, PNG, GIF, WebP
  • HEIC, HEIF (Apple-formaten)
  • Screenshots, foto's van documenten, gescande pagina's

Audiobestanden vereisen dat STT is geconfigureerd. Er is geen fallback β€” audio kan niet worden "geparseerd als tekst."

  • MP3, WAV, OGG, FLAC
  • M4A, WebM
  • Spraakopnames, podcastfragmenten

Uploaden als tekst versus andere uploadopties

LibreChat heeft drie manieren om bestanden te uploaden. Elke manier werkt anders en is geschikt voor verschillende situaties:

Snelkeuzegids:

SituatieBeste optie
"Lees dit contract van 5 pagina's en vat het samen"Upload als tekst
"Ik heb 50 pdf's, zoek naar vermeldingen van prijzen"Bestandszoekopdracht (RAG)
"Wat staat er op deze schermafbeelding?" (vision-model)Standaard upload
"Voer dit Python-script uit" (code-interpreter)Standaard upload
"Controleer dit codebestand op bugs"Upload als tekst
"Doorzoek onze bedrijfsdocumenten"Bestandszoekopdracht (RAG)

De context capability

Onder de motorkap wordt Upload as Text aangedreven door de context capability. Dit is wat bepaalt of de functie verschijnt in je chat-UI.

De context capability is standaard ingeschakeld. Je hoeft dit alleen aan te passen als je beheerder de lijst met capabilities heeft aangepast en deze per ongeluk heeft weggelaten.

librechat.yaml
endpoints:
  agents:
    capabilities:
      - "context"  # This is what enables "Upload as Text"

Dezelfde context functionaliteit drijft ook Agent File Context aan (het uploaden van bestanden via de Agent Builder om tekst in de systeemprompts van een agent in te sluiten). Het verschil is waar de tekst terechtkomt:

Upload as TextAgent File Context
WaarChat-invoer (elke conversatie)Agent Builder-paneel
BereikAlleen huidige conversatieBlijft behouden in de instructies van de agent
GebruiksscenarioEenmalige documentvragenHet bouwen van gespecialiseerde agents met ingebouwde kennis

Tokenlimieten en truncatie

Wanneer een bestand te lang is om in het contextvenster van het model te passen, kapt LibreChat de geΓ«xtraheerde tekst af om binnen de limieten te blijven. Dit gebeurt automatisch β€” je hoeft je hier geen zorgen over te maken, maar het is goed om te weten hoe het werkt.

librechat.yaml
fileConfig:
  fileTokenLimit: 100000  # Default: 100,000 tokens

Truncatie betekent verloren inhoud

Als je bestand de limiet overschrijdt, wordt de tekst aan het einde afgekapt. Als je onvolledige antwoorden krijgt, kan dit de reden zijn. Je kunt fileTokenLimit verhogen, maar houd er rekening mee dat hogere waarden meer tokens per bericht verbruiken β€” wat de kosten verhoogt en de eigen contextlimiet van het model kan overschrijden.

Vuistregels:

  • 100k tokens β‰ˆ een boek van 300 pagina's (ruim voldoende voor de meeste gebruiksdoeleinden)
  • Als je met zeer grote bestanden werkt, overweeg dan File Search (RAG) β€” dit haalt alleen de relevante secties op in plaats van alles in de context te proppen.

Optioneel: extractie verbeteren met OCR

Tekstverwerking werkt prima voor digitaal gemaakte documenten (PDF's opgeslagen vanuit Word, codebestanden, platte tekst). Maar als je ingescande documenten, foto's van pagina's of afbeeldingen met tekst uploadt, zal de ingebouwde parser geen geweldige resultaten opleveren.

Dat is waar OCR van pas komt. Wanneer dit is geconfigureerd, gebruikt LibreChat automatisch OCR voor bestandstypen die hiervan profiteren β€” als gebruiker hoef je niets anders te doen.


Referentie voor configuratie van bestandsafhandeling

Deze sectie is bedoeld voor beheerders die willen bepalen welke bestandstypen door welke methode worden verwerkt. De standaardinstellingen werken goed β€” je hoeft dit alleen aan te passen als je het gedrag wilt verfijnen.


Probleemoplossing


Hoe is deze gids?