Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack 🎉 Learn more
LibreChat

Téléverser des fichiers en tant que texte

Déposez n'importe quel fichier dans votre chat et laissez LibreChat le lire — aucune configuration nécessaire.

Téléverser des fichiers en tant que texte

Vous avez toujours voulu donner un PDF, un fichier de code ou une feuille de calcul à l'IA et simplement lui dire "lis ceci" ? C'est exactement ce que fait Upload as Text.

Vous joignez un fichier, LibreChat en extrait le texte, et le contenu complet est directement collé dans votre conversation. L'IA peut alors en lire chaque mot — sans plugins, sans bases de données vectorielles, ni services supplémentaires à configurer. Cela fonctionne immédiatement.

Aucune configuration requise

Upload as Text fonctionne immédiatement sur n'importe quelle instance LibreChat. Il utilise une analyse de texte intégrée — vous n'avez pas besoin d'OCR, de pipeline RAG ou de service externe pour commencer.


Comment l'utiliser

Cliquez sur l'icône de pièce jointe

Dans la barre de saisie du chat, cliquez sur l'icône trombone (📎).

Choisir "Upload as Text"

Dans le menu déroulant, sélectionnez Upload as Text. Cela indique à LibreChat de lire le contenu du fichier plutôt que de le transmettre en tant que pièce jointe brute.

Choisissez votre fichier

Sélectionnez le fichier depuis votre appareil. LibreChat extraira le texte et l'intégrera directement dans votre message.

Posez votre question

Tapez votre prompt comme d'habitude. L'IA dispose désormais du texte intégral de votre fichier dans son contexte et peut faire référence à n'importe quelle partie de celui-ci.

Vous ne voyez pas l'option ?

Si « Upload as Text » n'apparaît pas, la fonctionnalité context a peut-être été désactivée par votre administrateur. Elle est activée par défaut, mais si la liste des fonctionnalités a été personnalisée, context doit être explicitement inclus. Voir la section de configuration ci-dessous.


Ce qui se passe en coulisses

Lorsque vous téléversez un fichier de cette manière, LibreChat ne se contente pas d'insérer des octets bruts dans le prompt. Il exécute un pipeline de traitement pour extraire du texte propre et lisible :

  1. Détection du type MIME — LibreChat vérifie le type de fichier que vous avez téléchargé (PDF, image, audio, code source, etc.) en inspectant son type MIME.
  2. Sélection de la méthode — En fonction du type de fichier et des services disponibles, il choisit la meilleure méthode d'extraction en utilisant cette priorité :
PrioritéMéthodeQuand est-elle utilisée
1èreOCRLe fichier est une image ou un document numérisé, et l'OCR est configuré
2èmeSTT (Speech-to-Text)Le fichier est un audio, et le STT est configuré
3èmeAnalyse de texteLe fichier correspond à un type MIME de texte connu
4èmeRepliAucune des méthodes ci-dessus n'a correspondu — tente l'analyse de texte malgré tout
  1. Troncature de jetons — Le texte extrait est tronqué à la limite fileTokenLimit (par défaut : 100 000 jetons) afin de ne pas dépasser la fenêtre de contexte du modèle.
  2. Injection de prompt — Le texte est inclus dans le contexte de la conversation, juste à côté de votre message.

Quels fichiers sont pris en charge

Ceux-ci sont analysés directement — ce sont déjà du texte, donc aucune conversion n'est nécessaire.

  • Texte brut (.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS
  • Langages de programmation — Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
  • Fichiers de configuration — YAML, TOML, INI
  • Scripts shell, fichiers SQL

Télécharger en tant que texte vs. autres options de téléchargement

LibreChat propose trois méthodes pour télécharger des fichiers. Chacune fonctionne différemment et est adaptée à des situations différentes :

Guide de décision rapide :

SituationMeilleure option
"Lis ce contrat de 5 pages et résume-le"Téléverser en tant que texte
"J'ai 50 PDF, trouve ce qui mentionne les tarifs"Recherche de fichiers (RAG)
"Qu'y a-t-il dans cette capture d'écran ?" (modèle de vision)Téléversement standard
"Exécute ce script Python" (interprète de code)Téléversement standard
"Vérifie ce fichier de code pour détecter des bugs"Téléverser en tant que texte
"Recherche dans nos documents d'entreprise"Recherche de fichiers (RAG)

La fonctionnalité context

Sous le capot, Upload as Text est propulsé par la capacité context. C'est ce qui contrôle si la fonctionnalité apparaît dans votre interface de chat.

La fonctionnalité context est activée par défaut. Vous n'avez besoin d'y toucher que si votre administrateur a personnalisé la liste des fonctionnalités et l'a omise par erreur.

librechat.yaml
endpoints:
  agents:
    capabilities:
      - "context"  # This is what enables "Upload as Text"

La même fonctionnalité de context alimente également le Agent File Context (le téléchargement de fichiers via le constructeur d'agents pour intégrer du texte dans les instructions système d'un agent). La différence réside dans l'endroit où le texte finit par se trouver :

Télécharger en tant que texteContexte de fichier de l'agent
Entrée de chat (n'importe quelle conversation)Panneau du constructeur d'agent
PortéeConversation actuelle uniquementPersiste dans les instructions de l'agent
Cas d'utilisationQuestions ponctuelles sur un documentCréation d'agents spécialisés avec des connaissances intégrées

Limites de jetons et troncature

Lorsqu'un fichier est trop long pour tenir dans la fenêtre de contexte du modèle, LibreChat tronque le texte extrait pour rester dans les limites. Cela se produit automatiquement — vous n'avez pas à vous en soucier, mais il est bon de savoir comment cela fonctionne.

librechat.yaml
fileConfig:
  fileTokenLimit: 100000  # Default: 100,000 tokens

La troncature signifie une perte de contenu

Si votre fichier dépasse la limite, le texte est coupé à la fin. Si vous obtenez des réponses incomplètes, cela peut en être la raison. Vous pouvez augmenter fileTokenLimit, mais gardez à l'esprit que des valeurs plus élevées utilisent plus de jetons par message — ce qui augmente le coût et peut atteindre la limite de contexte du modèle lui-même.

Règles empiriques :

  • 100k tokens ≈ un livre de 300 pages (suffisant pour la plupart des cas d'utilisation)
  • Si vous travaillez avec des fichiers très volumineux, envisagez plutôt d'utiliser File Search (RAG) — cela ne récupère que les sections pertinentes au lieu de tout intégrer dans le contexte.

Optionnel : améliorer l'extraction avec l'OCR

L'analyse de texte fonctionne bien pour les documents créés numériquement (PDF enregistrés depuis Word, fichiers de code, texte brut). Mais si vous téléchargez des documents numérisés, des photos de pages ou des images contenant du texte, l'analyseur intégré n'obtiendra pas de très bons résultats.

C'est là qu'intervient l'OCR. Une fois configuré, LibreChat utilise automatiquement l'OCR pour les types de fichiers qui en bénéficient — vous n'avez rien à faire de particulier en tant qu'utilisateur.


Référence de configuration de la gestion des fichiers

Cette section est destinée aux administrateurs qui souhaitent contrôler quels types de fichiers sont traités par quelle méthode. Les paramètres par défaut fonctionnent bien — vous n'avez besoin d'intervenir ici que si vous souhaitez affiner le comportement.


Dépannage


Que pensez-vous de ce guide ?