Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack 🎉 Learn more
LibreChat

Carica file come testo

Trascina qualsiasi file nella tua chat e lascia che LibreChat lo legga: nessuna configurazione necessaria.

Carica file come testo

Hai mai desiderato consegnare un PDF, un file di codice o un foglio di calcolo all'AI e dire semplicemente "leggi questo"? È esattamente ciò che fa Upload as Text.

Alleghi un file, LibreChat ne estrae il testo e l'intero contenuto viene incollato direttamente nella tua conversazione. L'IA può quindi leggerne ogni parola: niente plugin, niente database vettoriali, nessun servizio aggiuntivo da configurare. Funziona immediatamente.

Nessuna configurazione richiesta

Upload as Text funziona immediatamente su qualsiasi istanza LibreChat. Utilizza l'analisi del testo integrata: non hai bisogno di OCR, di una pipeline RAG o di alcun servizio esterno per iniziare.


Come utilizzarlo

Fai clic sull'icona dell'allegato

Nella barra di input della chat, fai clic sull'icona della graffetta (📎).

Seleziona "Upload as Text"

Dal menu a discesa, seleziona Upload as Text. Questo indica a LibreChat di leggere il contenuto del file invece di trasmetterlo come allegato non elaborato.

Scegli il tuo file

Seleziona il file dal tuo dispositivo. LibreChat estrarrà il testo e lo incorporerà direttamente nel tuo messaggio.

Fai la tua domanda

Digita il tuo prompt come al solito. L'IA ora ha il testo completo del tuo file nel contesto e può fare riferimento a qualsiasi sua parte.

Non vedi l'opzione?

Se "Upload as Text" non appare, la funzionalità context potrebbe essere stata disabilitata dal tuo amministratore. È attiva per impostazione predefinita, ma se l'elenco delle funzionalità è stato personalizzato, context deve essere incluso esplicitamente. Consulta la sezione di configurazione qui sotto.


Cosa succede dietro le quinte

Quando carichi un file in questo modo, LibreChat non si limita a inserire byte grezzi nel prompt. Esegue una pipeline di elaborazione per estrarre testo pulito e leggibile:

  1. Rilevamento del tipo MIME — LibreChat controlla il tipo di file caricato (PDF, immagine, audio, codice sorgente, ecc.) ispezionando il suo tipo MIME.
  2. Selezione del metodo — In base al tipo di file e ai servizi disponibili, sceglie il miglior metodo di estrazione utilizzando questa priorità:
PrioritàMetodoQuando viene utilizzato
1°OCRIl file è un'immagine o un documento scansionato, e l'OCR è configurato
2°STT (Speech-to-Text)Il file è audio, e l'STT è configurato
3°Analisi del testoIl file corrisponde a un tipo MIME di testo noto
4°FallbackNessuno dei precedenti ha avuto esito positivo — tenta comunque l'analisi del testo

Un .pdf su un'istanza con OCR configurato: → L'OCR entra in funzione. Ottimo per documenti scansionati e layout complessi.

Un .pdf su un'istanza predefinita (senza OCR): → L'analisi del testo lo gestisce. Funziona bene per i PDF creati digitalmente.

Un file Python .py: → Parsing diretto del testo. Il codice sorgente è già testo: non è necessaria alcuna conversione.

Un .mp3 su un'istanza con STT configurato: → Speech-to-Text lo trascrive in testo per la conversazione.

Uno screenshot .png senza OCR configurato: → Ricorre all'analisi del testo (risultati limitati — considera di configurare l'OCR per le immagini).

  1. Troncamento dei token — Il testo estratto viene ridotto al fileTokenLimit (predefinito: 100.000 token) in modo che non superi la finestra di contesto del modello.
  2. Prompt injection — Il testo viene incluso nel contesto della conversazione, esattamente insieme al tuo messaggio.

Quali file sono supportati

Questi vengono analizzati direttamente — sono già testo, quindi non è necessaria alcuna conversione.

  • Testo semplice (.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS
  • Linguaggi di programmazione — Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
  • File di configurazione — YAML, TOML, INI
  • Script shell, file SQL

L'analisi del testo gestisce queste situazioni nativamente. Se l'OCR è configurato, subentra per una maggiore precisione su layout complessi.

  • PDF — digitali e scansionati (i PDF scansionati beneficiano dell'OCR)
  • Word — .docx, .doc
  • PowerPoint — .pptx, .ppt
  • Excel — .xlsx, .xls
  • Libri EPUB

Le immagini richiedono l'OCR per produrre testo utile. Senza di esso, i risultati saranno scadenti.

  • JPEG, PNG, GIF, WebP
  • HEIC, HEIF (formati Apple)
  • Screenshot, foto di documenti, pagine scansionate

I file audio richiedono che STT sia configurato. Non esiste un fallback: l'audio non può essere "analizzato come testo".

  • MP3, WAV, OGG, FLAC
  • M4A, WebM
  • Registrazioni vocali, clip di podcast

Caricamento come testo vs. altre opzioni di caricamento

LibreChat offre tre modi per caricare file. Ognuno funziona in modo diverso ed è adatto a situazioni differenti:

Guida rapida alle decisioni:

SituazioneOpzione migliore
"Leggi questo contratto di 5 pagine e riassumilo"Carica come testo
"Ho 50 PDF, trova dove si parla di prezzi"Ricerca file (RAG)
"Cosa c'è in questo screenshot?" (modello vision)Caricamento standard
"Esegui questo script Python" (interprete di codice)Caricamento standard
"Controlla questo file di codice per bug"Carica come testo
"Cerca nei documenti della nostra azienda"Ricerca file (RAG)

La funzionalità context

Sotto il cofano, Upload as Text è alimentato dalla funzionalità context. È questo che controlla se la funzione appare nella tua interfaccia di chat.

La funzionalità context è abilitata per impostazione predefinita. È necessario intervenire solo se l'amministratore ha personalizzato l'elenco delle funzionalità e l'ha accidentalmente omessa.

librechat.yaml
endpoints:
  agents:
    capabilities:
      - "context"  # This is what enables "Upload as Text"

La stessa funzionalità context alimenta anche Agent File Context (caricamento di file tramite l'Agent Builder per incorporare testo nelle istruzioni di sistema di un agente). La differenza sta in dove finisce il testo:

Caricamento come testoContesto file dell'agente
DoveInput della chat (qualsiasi conversazione)Pannello Agent Builder
AmbitoSolo conversazione correntePersiste nelle istruzioni dell'agente
Caso d'usoDomande su documenti una tantumCreazione di agenti specializzati con conoscenza integrata

Limiti dei token e troncamento

Quando un file è troppo lungo per rientrare nella finestra di contesto del modello, LibreChat tronca il testo estratto per rimanere entro i limiti. Questo avviene automaticamente: non devi preoccupartene, ma è utile sapere come funziona.

librechat.yaml
fileConfig:
  fileTokenLimit: 100000  # Default: 100,000 tokens

Il troncamento comporta la perdita di contenuti

Se il tuo file supera il limite, il testo viene troncato alla fine. Se ricevi risposte incomplete, questo potrebbe essere il motivo. Puoi aumentare fileTokenLimit, ma tieni presente che valori più grandi utilizzano più token per messaggio, il che aumenta i costi e potrebbe raggiungere il limite di contesto del modello stesso.

Regole generali:

  • 100k token ≈ un libro di 300 pagine (più che sufficiente per la maggior parte dei casi d'uso)
  • Se stai lavorando con file molto grandi, prendi in considerazione File Search (RAG) — recupera solo le sezioni pertinenti invece di inserire tutto nel contesto.

Opzionale: potenziare l'estrazione con OCR

L'analisi del testo funziona correttamente per i documenti creati digitalmente (PDF salvati da Word, file di codice, testo semplice). Tuttavia, se carichi documenti scansionati, foto di pagine o immagini contenenti testo, il parser integrato non otterrà risultati ottimali.

È qui che entra in gioco l'OCR. Quando configurato, LibreChat utilizza automaticamente l'OCR per i tipi di file che ne traggono vantaggio: non è necessario fare nulla di diverso come utente.


Riferimento alla configurazione della gestione dei file

Questa sezione è destinata agli amministratori che desiderano controllare quali tipi di file vengono elaborati con quale metodo. Le impostazioni predefinite funzionano bene: è necessario intervenire solo se si desidera ottimizzare il comportamento.


Risoluzione dei problemi


Com’è questa guida?