Trascina qualsiasi file nella tua chat e lascia che LibreChat lo legga: nessuna configurazione necessaria.

Carica file come testo

Hai mai desiderato consegnare un PDF, un file di codice o un foglio di calcolo all'AI e dire semplicemente "leggi questo"? È esattamente ciò che fa Upload as Text.

Alleghi un file, LibreChat ne estrae il testo e l'intero contenuto viene incollato direttamente nella tua conversazione. L'IA può quindi leggerne ogni parola: niente plugin, niente database vettoriali, nessun servizio aggiuntivo da configurare. Funziona immediatamente.

Nessuna configurazione richiesta

Upload as Text funziona immediatamente su qualsiasi istanza LibreChat. Utilizza l'analisi del testo integrata: non hai bisogno di OCR, di una pipeline RAG o di alcun servizio esterno per iniziare.

Come utilizzarlo

Fai clic sull'icona dell'allegato

Nella barra di input della chat, fai clic sull'icona della graffetta (📎).

Seleziona "Upload as Text"

Dal menu a discesa, seleziona Upload as Text. Questo indica a LibreChat di leggere il contenuto del file invece di trasmetterlo come allegato non elaborato.

Scegli il tuo file

Seleziona il file dal tuo dispositivo. LibreChat estrarrà il testo e lo incorporerà direttamente nel tuo messaggio.

Fai la tua domanda

Digita il tuo prompt come al solito. L'IA ora ha il testo completo del tuo file nel contesto e può fare riferimento a qualsiasi sua parte.

Non vedi l'opzione?

Se "Upload as Text" non appare, la funzionalità context potrebbe essere stata disabilitata dal tuo amministratore. È attiva per impostazione predefinita, ma se l'elenco delle funzionalità è stato personalizzato, context deve essere incluso esplicitamente. Consulta la sezione di configurazione qui sotto.

Cosa succede dietro le quinte

Quando carichi un file in questo modo, LibreChat non si limita a inserire byte grezzi nel prompt. Esegue una pipeline di elaborazione per estrarre testo pulito e leggibile:

Rilevamento del tipo MIME — LibreChat controlla il tipo di file caricato (PDF, immagine, audio, codice sorgente, ecc.) ispezionando il suo tipo MIME.
Selezione del metodo — In base al tipo di file e ai servizi disponibili, sceglie il miglior metodo di estrazione utilizzando questa priorità:

Priorità	Metodo	Quando viene utilizzato
1°	OCR	Il file è un'immagine o un documento scansionato, e l'OCR è configurato
2°	STT (Speech-to-Text)	Il file è audio, e l'STT è configurato
3°	Analisi del testo	Il file corrisponde a un tipo MIME di testo noto
4°	Fallback	Nessuno dei precedenti ha avuto esito positivo — tenta comunque l'analisi del testo

Un .pdf su un'istanza con OCR configurato: → L'OCR entra in funzione. Ottimo per documenti scansionati e layout complessi.

Un .pdf su un'istanza predefinita (senza OCR): → L'analisi del testo lo gestisce. Funziona bene per i PDF creati digitalmente.

Un file Python .py: → Parsing diretto del testo. Il codice sorgente è già testo: non è necessaria alcuna conversione.

Un .mp3 su un'istanza con STT configurato: → Speech-to-Text lo trascrive in testo per la conversazione.

Uno screenshot .png senza OCR configurato: → Ricorre all'analisi del testo (risultati limitati — considera di configurare l'OCR per le immagini).

Troncamento dei token — Il testo estratto viene ridotto al fileTokenLimit (predefinito: 100.000 token) in modo che non superi la finestra di contesto del modello.
Prompt injection — Il testo viene incluso nel contesto della conversazione, esattamente insieme al tuo messaggio.

Quali file sono supportati

Questi vengono analizzati direttamente — sono già testo, quindi non è necessaria alcuna conversione.

Testo semplice (.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS
Linguaggi di programmazione — Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
File di configurazione — YAML, TOML, INI
Script shell, file SQL

L'analisi del testo gestisce queste situazioni nativamente. Se l'OCR è configurato, subentra per una maggiore precisione su layout complessi.

PDF — digitali e scansionati (i PDF scansionati beneficiano dell'OCR)
Word — .docx, .doc
PowerPoint — .pptx, .ppt
Excel — .xlsx, .xls
Libri EPUB

Le immagini richiedono l'OCR per produrre testo utile. Senza di esso, i risultati saranno scadenti.

JPEG, PNG, GIF, WebP
HEIC, HEIF (formati Apple)
Screenshot, foto di documenti, pagine scansionate

I file audio richiedono che STT sia configurato. Non esiste un fallback: l'audio non può essere "analizzato come testo".

MP3, WAV, OGG, FLAC
M4A, WebM
Registrazioni vocali, clip di podcast

Caricamento come testo vs. altre opzioni di caricamento

LibreChat offre tre modi per caricare file. Ognuno funziona in modo diverso ed è adatto a situazioni differenti:

Carica come testo

Estrae l'intero contenuto del file e lo inserisce nella conversazione. Ideale per file più piccoli in cui si desidera che l'IA legga tutto: contratti, file di codice, articoli. Funziona con tutti i modelli, senza bisogno di servizi aggiuntivi.

Caricamento per Ricerca File (RAG)

Indicizza il file in un database vettoriale e recupera solo i chunk rilevanti quando poni una domanda. È preferibile per file di grandi dimensioni o raccolte di file in cui inserire tutto nel contesto comporterebbe uno spreco di token. Richiede la RAG API.

Caricamento standard

Passa il file direttamente al modello — utilizzato per i modelli di visione che analizzano immagini, o per l'interprete di codice che esegue script. Non viene effettuata alcuna estrazione di testo.

Guida rapida alle decisioni:

Situazione	Opzione migliore
"Leggi questo contratto di 5 pagine e riassumilo"	Carica come testo
"Ho 50 PDF, trova dove si parla di prezzi"	Ricerca file (RAG)
"Cosa c'è in questo screenshot?" (modello vision)	Caricamento standard
"Esegui questo script Python" (interprete di codice)	Caricamento standard
"Controlla questo file di codice per bug"	Carica come testo
"Cerca nei documenti della nostra azienda"	Ricerca file (RAG)

La funzionalità `context`

Sotto il cofano, Upload as Text è alimentato dalla funzionalità context. È questo che controlla se la funzione appare nella tua interfaccia di chat.

La funzionalità context è abilitata per impostazione predefinita. È necessario intervenire solo se l'amministratore ha personalizzato l'elenco delle funzionalità e l'ha accidentalmente omessa.

librechat.yaml

endpoints:
  agents:
    capabilities:
      - "context"  # This is what enables "Upload as Text"

La stessa funzionalità context alimenta anche Agent File Context (caricamento di file tramite l'Agent Builder per incorporare testo nelle istruzioni di sistema di un agente). La differenza sta in dove finisce il testo:

	Caricamento come testo	Contesto file dell'agente
Dove	Input della chat (qualsiasi conversazione)	Pannello Agent Builder
Ambito	Solo conversazione corrente	Persiste nelle istruzioni dell'agente
Caso d'uso	Domande su documenti una tantum	Creazione di agenti specializzati con conoscenza integrata

Limiti dei token e troncamento

Quando un file è troppo lungo per rientrare nella finestra di contesto del modello, LibreChat tronca il testo estratto per rimanere entro i limiti. Questo avviene automaticamente: non devi preoccupartene, ma è utile sapere come funziona.

librechat.yaml

fileConfig:
  fileTokenLimit: 100000  # Default: 100,000 tokens

Il troncamento comporta la perdita di contenuti

Se il tuo file supera il limite, il testo viene troncato alla fine. Se ricevi risposte incomplete, questo potrebbe essere il motivo. Puoi aumentare fileTokenLimit, ma tieni presente che valori più grandi utilizzano più token per messaggio, il che aumenta i costi e potrebbe raggiungere il limite di contesto del modello stesso.

Regole generali:

100k token ≈ un libro di 300 pagine (più che sufficiente per la maggior parte dei casi d'uso)
Se stai lavorando con file molto grandi, prendi in considerazione File Search (RAG) — recupera solo le sezioni pertinenti invece di inserire tutto nel contesto.

Opzionale: potenziare l'estrazione con OCR

L'analisi del testo funziona correttamente per i documenti creati digitalmente (PDF salvati da Word, file di codice, testo semplice). Tuttavia, se carichi documenti scansionati, foto di pagine o immagini contenenti testo, il parser integrato non otterrà risultati ottimali.

È qui che entra in gioco l'OCR. Quando configurato, LibreChat utilizza automaticamente l'OCR per i tipi di file che ne traggono vantaggio: non è necessario fare nulla di diverso come utente.

Riferimento alla configurazione della gestione dei file

Questa sezione è destinata agli amministratori che desiderano controllare quali tipi di file vengono elaborati con quale metodo. Le impostazioni predefinite funzionano bene: è necessario intervenire solo se si desidera ottimizzare il comportamento.

Risoluzione dei problemi

OCR per i documenti — Configura il riconoscimento ottico dei caratteri per immagini e scansioni
RAG API (Chat with Files) — Ricerca semantica su ampie raccolte di documenti
Agenti — Contesto dei file — Incorpora il contenuto dei file nelle istruzioni di sistema di un agente
Riferimento File Config — Schema YAML completo per la gestione dei file

Carica file come testo

Carica come testo

Caricamento per Ricerca File (RAG)

Caricamento standard

Come chiedere al tuo amministratore di configurare l'OCR

Come chiedere al tuo amministratore di configurare STT (per i file audio)

Esempio completo di fileConfig

L'opzione Carica come testo non appare

Il contenuto del file sembra errato o è quasi vuoto

L'IA sembra aver perso una parte del mio file

Le immagini vengono caricate ma l'IA non riesce a leggere il testo al loro interno

In questa pagina