Carica file come testo
Trascina qualsiasi file nella tua chat e lascia che LibreChat lo legga: nessuna configurazione necessaria.
Carica file come testo
Hai mai desiderato consegnare un PDF, un file di codice o un foglio di calcolo all'AI e dire semplicemente "leggi questo"? È esattamente ciò che fa Upload as Text.
Alleghi un file, LibreChat ne estrae il testo e l'intero contenuto viene incollato direttamente nella tua conversazione. L'IA può quindi leggerne ogni parola: niente plugin, niente database vettoriali, nessun servizio aggiuntivo da configurare. Funziona immediatamente.
Nessuna configurazione richiesta
Upload as Text funziona immediatamente su qualsiasi istanza LibreChat. Utilizza l'analisi del testo integrata: non hai bisogno di OCR, di una pipeline RAG o di alcun servizio esterno per iniziare.
Come utilizzarlo
Fai clic sull'icona dell'allegato
Nella barra di input della chat, fai clic sull'icona della graffetta (📎).
Seleziona "Upload as Text"
Dal menu a discesa, seleziona Upload as Text. Questo indica a LibreChat di leggere il contenuto del file invece di trasmetterlo come allegato non elaborato.
Scegli il tuo file
Seleziona il file dal tuo dispositivo. LibreChat estrarrà il testo e lo incorporerà direttamente nel tuo messaggio.
Fai la tua domanda
Digita il tuo prompt come al solito. L'IA ora ha il testo completo del tuo file nel contesto e può fare riferimento a qualsiasi sua parte.
Non vedi l'opzione?
Se "Upload as Text" non appare, la funzionalità context potrebbe essere stata disabilitata dal tuo amministratore. È attiva per impostazione predefinita, ma se l'elenco delle funzionalità è stato personalizzato, context deve essere incluso esplicitamente. Consulta la sezione di configurazione qui sotto.
Cosa succede dietro le quinte
Quando carichi un file in questo modo, LibreChat non si limita a inserire byte grezzi nel prompt. Esegue una pipeline di elaborazione per estrarre testo pulito e leggibile:
- Rilevamento del tipo MIME — LibreChat controlla il tipo di file caricato (PDF, immagine, audio, codice sorgente, ecc.) ispezionando il suo tipo MIME.
- Selezione del metodo — In base al tipo di file e ai servizi disponibili, sceglie il miglior metodo di estrazione utilizzando questa priorità :
| Priorità | Metodo | Quando viene utilizzato |
|---|---|---|
| 1° | OCR | Il file è un'immagine o un documento scansionato, e l'OCR è configurato |
| 2° | STT (Speech-to-Text) | Il file è audio, e l'STT è configurato |
| 3° | Analisi del testo | Il file corrisponde a un tipo MIME di testo noto |
| 4° | Fallback | Nessuno dei precedenti ha avuto esito positivo — tenta comunque l'analisi del testo |
Un .pdf su un'istanza con OCR configurato:
→ L'OCR entra in funzione. Ottimo per documenti scansionati e layout complessi.
Un .pdf su un'istanza predefinita (senza OCR):
→ L'analisi del testo lo gestisce. Funziona bene per i PDF creati digitalmente.
Un file Python .py:
→ Parsing diretto del testo. Il codice sorgente è già testo: non è necessaria alcuna conversione.
Un .mp3 su un'istanza con STT configurato:
→ Speech-to-Text lo trascrive in testo per la conversazione.
Uno screenshot .png senza OCR configurato:
→ Ricorre all'analisi del testo (risultati limitati — considera di configurare l'OCR per le immagini).
- Troncamento dei token — Il testo estratto viene ridotto al
fileTokenLimit(predefinito: 100.000 token) in modo che non superi la finestra di contesto del modello. - Prompt injection — Il testo viene incluso nel contesto della conversazione, esattamente insieme al tuo messaggio.
Quali file sono supportati
Questi vengono analizzati direttamente — sono già testo, quindi non è necessaria alcuna conversione.
- Testo semplice (
.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS - Linguaggi di programmazione — Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
- File di configurazione — YAML, TOML, INI
- Script shell, file SQL
L'analisi del testo gestisce queste situazioni nativamente. Se l'OCR è configurato, subentra per una maggiore precisione su layout complessi.
- PDF — digitali e scansionati (i PDF scansionati beneficiano dell'OCR)
- Word —
.docx,.doc - PowerPoint —
.pptx,.ppt - Excel —
.xlsx,.xls - Libri EPUB
Le immagini richiedono l'OCR per produrre testo utile. Senza di esso, i risultati saranno scadenti.
- JPEG, PNG, GIF, WebP
- HEIC, HEIF (formati Apple)
- Screenshot, foto di documenti, pagine scansionate
I file audio richiedono che STT sia configurato. Non esiste un fallback: l'audio non può essere "analizzato come testo".
- MP3, WAV, OGG, FLAC
- M4A, WebM
- Registrazioni vocali, clip di podcast
Caricamento come testo vs. altre opzioni di caricamento
LibreChat offre tre modi per caricare file. Ognuno funziona in modo diverso ed è adatto a situazioni differenti:
Carica come testo
Estrae l'intero contenuto del file e lo inserisce nella conversazione. Ideale per file più piccoli in cui si desidera che l'IA legga tutto: contratti, file di codice, articoli. Funziona con tutti i modelli, senza bisogno di servizi aggiuntivi.
Caricamento per Ricerca File (RAG)
Indicizza il file in un database vettoriale e recupera solo i chunk rilevanti quando poni una domanda. È preferibile per file di grandi dimensioni o raccolte di file in cui inserire tutto nel contesto comporterebbe uno spreco di token. Richiede la RAG API.
Caricamento standard
Passa il file direttamente al modello — utilizzato per i modelli di visione che analizzano immagini, o per l'interprete di codice che esegue script. Non viene effettuata alcuna estrazione di testo.
Guida rapida alle decisioni:
| Situazione | Opzione migliore |
|---|---|
| "Leggi questo contratto di 5 pagine e riassumilo" | Carica come testo |
| "Ho 50 PDF, trova dove si parla di prezzi" | Ricerca file (RAG) |
| "Cosa c'è in questo screenshot?" (modello vision) | Caricamento standard |
| "Esegui questo script Python" (interprete di codice) | Caricamento standard |
| "Controlla questo file di codice per bug" | Carica come testo |
| "Cerca nei documenti della nostra azienda" | Ricerca file (RAG) |
La funzionalità context
Sotto il cofano, Upload as Text è alimentato dalla funzionalità context. È questo che controlla se la funzione appare nella tua interfaccia di chat.
La funzionalità context è abilitata per impostazione predefinita. È necessario intervenire solo se l'amministratore ha personalizzato l'elenco delle funzionalità e l'ha accidentalmente omessa.
endpoints:
agents:
capabilities:
- "context" # This is what enables "Upload as Text"La stessa funzionalità context alimenta anche Agent File Context (caricamento di file tramite l'Agent Builder per incorporare testo nelle istruzioni di sistema di un agente). La differenza sta in dove finisce il testo:
| Caricamento come testo | Contesto file dell'agente | |
|---|---|---|
| Dove | Input della chat (qualsiasi conversazione) | Pannello Agent Builder |
| Ambito | Solo conversazione corrente | Persiste nelle istruzioni dell'agente |
| Caso d'uso | Domande su documenti una tantum | Creazione di agenti specializzati con conoscenza integrata |
Limiti dei token e troncamento
Quando un file è troppo lungo per rientrare nella finestra di contesto del modello, LibreChat tronca il testo estratto per rimanere entro i limiti. Questo avviene automaticamente: non devi preoccupartene, ma è utile sapere come funziona.
fileConfig:
fileTokenLimit: 100000 # Default: 100,000 tokensIl troncamento comporta la perdita di contenuti
Se il tuo file supera il limite, il testo viene troncato alla fine. Se ricevi risposte incomplete, questo potrebbe essere il motivo. Puoi aumentare fileTokenLimit, ma tieni presente che valori più grandi utilizzano più token per messaggio, il che aumenta i costi e potrebbe raggiungere il limite di contesto del modello stesso.
Regole generali:
- 100k token ≈ un libro di 300 pagine (più che sufficiente per la maggior parte dei casi d'uso)
- Se stai lavorando con file molto grandi, prendi in considerazione File Search (RAG) — recupera solo le sezioni pertinenti invece di inserire tutto nel contesto.
Opzionale: potenziare l'estrazione con OCR
L'analisi del testo funziona correttamente per i documenti creati digitalmente (PDF salvati da Word, file di codice, testo semplice). Tuttavia, se carichi documenti scansionati, foto di pagine o immagini contenenti testo, il parser integrato non otterrà risultati ottimali.
È qui che entra in gioco l'OCR. Quando configurato, LibreChat utilizza automaticamente l'OCR per i tipi di file che ne traggono vantaggio: non è necessario fare nulla di diverso come utente.
Riferimento alla configurazione della gestione dei file
Questa sezione è destinata agli amministratori che desiderano controllare quali tipi di file vengono elaborati con quale metodo. Le impostazioni predefinite funzionano bene: è necessario intervenire solo se si desidera ottimizzare il comportamento.
Risoluzione dei problemi
Correlati
- OCR per i documenti — Configura il riconoscimento ottico dei caratteri per immagini e scansioni
- RAG API (Chat with Files) — Ricerca semantica su ampie raccolte di documenti
- Agenti — Contesto dei file — Incorpora il contenuto dei file nelle istruzioni di sistema di un agente
- Riferimento File Config — Schema YAML completo per la gestione dei file
Com’è questa guida?
API RAG (Chat con i file)
API di Retrieval-Augmented Generation (RAG) per l'indicizzazione e il recupero di documenti tramite Langchain e FastAPI. Questa API si integra con LibreChat per fornire risposte basate sul contesto utilizzando i file caricati dall'utente.
OCR per documenti
Scopri come configurare il riconoscimento ottico dei caratteri (OCR) per migliorare l'estrazione del testo nelle funzionalità di caricamento file di LibreChat.