Téléverser des fichiers en tant que texte
Déposez n'importe quel fichier dans votre chat et laissez LibreChat le lire — aucune configuration nécessaire.
Téléverser des fichiers en tant que texte
Vous avez toujours voulu donner un PDF, un fichier de code ou une feuille de calcul à l'IA et simplement lui dire "lis ceci" ? C'est exactement ce que fait Upload as Text.
Vous joignez un fichier, LibreChat en extrait le texte, et le contenu complet est directement collé dans votre conversation. L'IA peut alors en lire chaque mot — sans plugins, sans bases de données vectorielles, ni services supplémentaires à configurer. Cela fonctionne immédiatement.
Aucune configuration requise
Upload as Text fonctionne immédiatement sur n'importe quelle instance LibreChat. Il utilise une analyse de texte intégrée — vous n'avez pas besoin d'OCR, de pipeline RAG ou de service externe pour commencer.
Comment l'utiliser
Cliquez sur l'icône de pièce jointe
Dans la barre de saisie du chat, cliquez sur l'icône trombone (📎).
Choisir "Upload as Text"
Dans le menu déroulant, sélectionnez Upload as Text. Cela indique à LibreChat de lire le contenu du fichier plutôt que de le transmettre en tant que pièce jointe brute.
Choisissez votre fichier
Sélectionnez le fichier depuis votre appareil. LibreChat extraira le texte et l'intégrera directement dans votre message.
Posez votre question
Tapez votre prompt comme d'habitude. L'IA dispose désormais du texte intégral de votre fichier dans son contexte et peut faire référence à n'importe quelle partie de celui-ci.
Vous ne voyez pas l'option ?
Si « Upload as Text » n'apparaît pas, la fonctionnalité context a peut-être été désactivée par votre administrateur. Elle est activée par défaut, mais si la liste des fonctionnalités a été personnalisée, context doit être explicitement inclus. Voir la section de configuration ci-dessous.
Ce qui se passe en coulisses
Lorsque vous téléversez un fichier de cette manière, LibreChat ne se contente pas d'insérer des octets bruts dans le prompt. Il exécute un pipeline de traitement pour extraire du texte propre et lisible :
- Détection du type MIME — LibreChat vérifie le type de fichier que vous avez téléchargé (PDF, image, audio, code source, etc.) en inspectant son type MIME.
- Sélection de la méthode — En fonction du type de fichier et des services disponibles, il choisit la meilleure méthode d'extraction en utilisant cette priorité :
| Priorité | Méthode | Quand est-elle utilisée |
|---|---|---|
| 1ère | OCR | Le fichier est une image ou un document numérisé, et l'OCR est configuré |
| 2ème | STT (Speech-to-Text) | Le fichier est un audio, et le STT est configuré |
| 3ème | Analyse de texte | Le fichier correspond à un type MIME de texte connu |
| 4ème | Repli | Aucune des méthodes ci-dessus n'a correspondu — tente l'analyse de texte malgré tout |
- Troncature de jetons — Le texte extrait est tronqué à la limite
fileTokenLimit(par défaut : 100 000 jetons) afin de ne pas dépasser la fenêtre de contexte du modèle. - Injection de prompt — Le texte est inclus dans le contexte de la conversation, juste à côté de votre message.
Quels fichiers sont pris en charge
Ceux-ci sont analysés directement — ce sont déjà du texte, donc aucune conversion n'est nécessaire.
- Texte brut (
.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS - Langages de programmation — Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
- Fichiers de configuration — YAML, TOML, INI
- Scripts shell, fichiers SQL
Télécharger en tant que texte vs. autres options de téléchargement
LibreChat propose trois méthodes pour télécharger des fichiers. Chacune fonctionne différemment et est adaptée à des situations différentes :
Télécharger en tant que texte
Extrait le contenu complet du fichier et l'insère dans la conversation. Idéal pour les petits fichiers dont vous souhaitez que l'IA lise l'intégralité — contrats, fichiers de code, articles. Fonctionne avec tous les modèles, aucun service supplémentaire requis.
Téléchargement pour la recherche de fichiers (RAG)
Indexe le fichier dans une base de données vectorielle et ne récupère que les segments pertinents lorsque vous posez une question. Mieux adapté aux fichiers volumineux ou aux collections de fichiers où tout intégrer dans le contexte gaspillerait des jetons. Nécessite l'API RAG.
Téléchargement standard
Transmet le fichier directement au modèle — utilisé pour les modèles de vision analysant des images, ou pour l'interpréteur de code exécutant des scripts. Aucune extraction de texte n'est effectuée.
Guide de décision rapide :
| Situation | Meilleure option |
|---|---|
| "Lis ce contrat de 5 pages et résume-le" | Téléverser en tant que texte |
| "J'ai 50 PDF, trouve ce qui mentionne les tarifs" | Recherche de fichiers (RAG) |
| "Qu'y a-t-il dans cette capture d'écran ?" (modèle de vision) | Téléversement standard |
| "Exécute ce script Python" (interprète de code) | Téléversement standard |
| "Vérifie ce fichier de code pour détecter des bugs" | Téléverser en tant que texte |
| "Recherche dans nos documents d'entreprise" | Recherche de fichiers (RAG) |
La fonctionnalité context
Sous le capot, Upload as Text est propulsé par la capacité context. C'est ce qui contrôle si la fonctionnalité apparaît dans votre interface de chat.
La fonctionnalité context est activée par défaut. Vous n'avez besoin d'y toucher que si votre administrateur a personnalisé la liste des fonctionnalités et l'a omise par erreur.
La même fonctionnalité de context alimente également le Agent File Context (le téléchargement de fichiers via le constructeur d'agents pour intégrer du texte dans les instructions système d'un agent). La différence réside dans l'endroit où le texte finit par se trouver :
| Télécharger en tant que texte | Contexte de fichier de l'agent | |
|---|---|---|
| Où | Entrée de chat (n'importe quelle conversation) | Panneau du constructeur d'agent |
| Portée | Conversation actuelle uniquement | Persiste dans les instructions de l'agent |
| Cas d'utilisation | Questions ponctuelles sur un document | Création d'agents spécialisés avec des connaissances intégrées |
Limites de jetons et troncature
Lorsqu'un fichier est trop long pour tenir dans la fenêtre de contexte du modèle, LibreChat tronque le texte extrait pour rester dans les limites. Cela se produit automatiquement — vous n'avez pas à vous en soucier, mais il est bon de savoir comment cela fonctionne.
La troncature signifie une perte de contenu
Si votre fichier dépasse la limite, le texte est coupé à la fin. Si vous obtenez des réponses incomplètes, cela peut en être la raison. Vous pouvez augmenter fileTokenLimit, mais gardez à l'esprit que des valeurs plus élevées utilisent plus de jetons par message — ce qui augmente le coût et peut atteindre la limite de contexte du modèle lui-même.
Règles empiriques :
- 100k tokens ≈ un livre de 300 pages (suffisant pour la plupart des cas d'utilisation)
- Si vous travaillez avec des fichiers très volumineux, envisagez plutôt d'utiliser File Search (RAG) — cela ne récupère que les sections pertinentes au lieu de tout intégrer dans le contexte.
Optionnel : améliorer l'extraction avec l'OCR
L'analyse de texte fonctionne bien pour les documents créés numériquement (PDF enregistrés depuis Word, fichiers de code, texte brut). Mais si vous téléchargez des documents numérisés, des photos de pages ou des images contenant du texte, l'analyseur intégré n'obtiendra pas de très bons résultats.
C'est là qu'intervient l'OCR. Une fois configuré, LibreChat utilise automatiquement l'OCR pour les types de fichiers qui en bénéficient — vous n'avez rien à faire de particulier en tant qu'utilisateur.
Référence de configuration de la gestion des fichiers
Cette section est destinée aux administrateurs qui souhaitent contrôler quels types de fichiers sont traités par quelle méthode. Les paramètres par défaut fonctionnent bien — vous n'avez besoin d'intervenir ici que si vous souhaitez affiner le comportement.
Dépannage
Connexe
- OCR pour les documents — Configurez la reconnaissance optique de caractères pour les images et les scans
- RAG API (Chat with Files) — Recherche sémantique sur de grandes collections de documents
- Agents — Contexte de fichier — Intégrer le contenu d'un fichier dans les instructions système d'un agent
- Référence de la configuration des fichiers — Schéma YAML complet pour la gestion des fichiers
Que pensez-vous de ce guide ?