Solte qualquer arquivo no seu chat e deixe o LibreChat lê-lo — nenhuma configuração necessária.

Fazer upload de arquivos como texto

Já quis entregar um PDF, um arquivo de código ou uma planilha para a IA e simplesmente dizer "leia isto"? É exatamente isso que o Upload as Text faz.

Você anexa um arquivo, o LibreChat extrai o texto dele e o conteúdo completo é colado diretamente na sua conversa. A IA pode então ler cada palavra dele — sem plugins, sem bancos de dados vetoriais, sem serviços extras para configurar. Funciona nativamente.

Nenhuma configuração necessária

Upload as Text funciona imediatamente em qualquer instância do LibreChat. Ele utiliza análise de texto integrada — você não precisa de OCR, um pipeline de RAG ou qualquer serviço externo para começar.

Como usar

Clique no ícone de anexo

Na barra de entrada de chat, clique no ícone de clipe de papel (📎).

Escolha "Upload as Text"

No menu suspenso, selecione Upload as Text. Isso instrui o LibreChat a ler o conteúdo do arquivo em vez de enviá-lo como um anexo bruto.

Escolha seu arquivo

Selecione o arquivo do seu dispositivo. O LibreChat extrairá o texto e o incorporará diretamente na sua mensagem.

Faça sua pergunta

Digite seu prompt como de costume. A IA agora tem o texto completo do seu arquivo no contexto e pode referenciar qualquer parte dele.

Não vê a opção?

Se "Upload as Text" não aparecer, a capacidade context pode ter sido desativada pelo seu administrador. Ela está ativada por padrão — mas se a lista de capacidades foi personalizada, context precisa ser incluído explicitamente. Veja a seção de configuração abaixo.

O que acontece nos bastidores

Quando você faz upload de um arquivo desta forma, o LibreChat não apenas despeja bytes brutos no prompt. Ele executa um pipeline de processamento para extrair texto limpo e legível:

Detecção de tipo MIME — O LibreChat verifica que tipo de arquivo você enviou (PDF, imagem, áudio, código-fonte, etc.) inspecionando seu tipo MIME.
Seleção de método — Com base no tipo de arquivo e nos serviços disponíveis, ele escolhe o melhor método de extração usando esta prioridade:

Prioridade	Método	Quando é usado
1ª	OCR	O arquivo é uma imagem ou documento digitalizado, e o OCR está configurado
2ª	STT (Speech-to-Text)	O arquivo é áudio, e o STT está configurado
3ª	Análise de texto	O arquivo corresponde a um tipo MIME de texto conhecido
4ª	Fallback	Nenhum dos anteriores correspondeu — tenta a análise de texto de qualquer maneira

Um .pdf em uma instância com OCR configurado: → O OCR é ativado. Ótimo para documentos digitalizados e layouts complexos.

Um .pdf em uma instância padrão (sem OCR): → O processamento de texto lida com isso. Funciona bem para PDFs criados digitalmente.

Um arquivo Python .py: → Direto para a análise de texto. O código-fonte já é texto — nenhuma conversão é necessária.

Um .mp3 em uma instância com STT configurado: → Speech-to-Text transcreve-o em texto para a conversa.

Uma captura de tela .png sem OCR configurado: → Recorre à análise de texto (resultados limitados — considere configurar o OCR para imagens).

Truncamento de tokens — O texto extraído é cortado de acordo com o fileTokenLimit (padrão: 100.000 tokens) para que não exceda a janela de contexto do modelo.
Prompt injection — O texto é incluído no contexto da conversa, exatamente ao lado da sua mensagem.

Quais arquivos são suportados

Estes são analisados diretamente — eles já são texto, portanto, nenhuma conversão é necessária.

Texto simples (.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS
Linguagens de programação — Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
Arquivos de configuração — YAML, TOML, INI
Scripts de shell, arquivos SQL

A análise de texto lida com isso nativamente. Se o OCR estiver configurado, ele assume o controle para obter melhor precisão em layouts complexos.

PDF — digital e digitalizado (PDFs digitalizados se beneficiam de OCR)
Word — .docx, .doc
PowerPoint — .pptx, .ppt
Excel — .xlsx, .xls
Livros EPUB

Imagens exigem OCR para produzir texto útil. Sem isso, os resultados serão insatisfatórios.

JPEG, PNG, GIF, WebP
HEIC, HEIF (formatos da Apple)
Capturas de tela, fotos de documentos, páginas digitalizadas

Arquivos de áudio exigem que o STT esteja configurado. Não há fallback — o áudio não pode ser "analisado como texto".

MP3, WAV, OGG, FLAC
M4A, WebM
Gravações de voz, clipes de podcast

Upload como texto vs. outras opções de upload

O LibreChat possui três maneiras de fazer upload de arquivos. Cada uma funciona de forma diferente e se adapta a situações distintas:

Fazer upload como texto

Extrai o conteúdo completo do arquivo e o insere na conversa. Ideal para arquivos menores onde você deseja que a IA leia tudo — contratos, arquivos de código, artigos. Funciona com todos os modelos, sem necessidade de serviços adicionais.

Upload para Pesquisa de Arquivos (RAG)

Indexa o arquivo em um banco de dados vetorial e recupera apenas os trechos relevantes quando você faz uma pergunta. Melhor para arquivos grandes ou coleções de arquivos onde despejar tudo no contexto desperdiçaria tokens. Requer a RAG API.

Upload Padrão

Passa o arquivo diretamente para o modelo — usado para modelos de visão que analisam imagens, ou para o interpretador de código que executa scripts. Nenhuma extração de texto é realizada.

Guia de decisão rápida:

Situação	Melhor opção
"Leia este contrato de 5 páginas e resuma-o"	Upload as Text
"Tenho 50 PDFs, encontre o que menciona preços"	File Search (RAG)
"O que há nesta captura de tela?" (modelo de visão)	Standard Upload
"Execute este script Python" (interpretador de código)	Standard Upload
"Revise este arquivo de código em busca de bugs"	Upload as Text
"Pesquise em nossos documentos da empresa"	File Search (RAG)

A capacidade `context`

Por baixo dos panos, o Upload as Text é alimentado pela capacidade context. É isso que controla se o recurso aparece na sua interface de chat.

A funcionalidade context está habilitada por padrão. Você só precisa alterar isso se o seu administrador tiver personalizado a lista de funcionalidades e a tiver removido acidentalmente.

librechat.yaml

endpoints:
  agents:
    capabilities:
      - "context"  # This is what enables "Upload as Text"

A mesma funcionalidade de context também impulsiona o Agent File Context (upload de arquivos através do Agent Builder para incorporar texto nas instruções de sistema de um agente). A diferença é onde o texto termina:

	Upload as Text	Agent File Context
Onde	Entrada de chat (qualquer conversa)	Painel do Agent Builder
Escopo	Apenas a conversa atual	Persiste nas instruções do agente
Caso de uso	Perguntas pontuais sobre documentos	Criação de agentes especializados com conhecimento integrado

Limites de tokens e truncamento

Quando um arquivo é longo demais para caber na janela de contexto do modelo, o LibreChat trunca o texto extraído para permanecer dentro dos limites. Isso acontece automaticamente — você não precisa se preocupar com isso, mas é bom saber como funciona.

librechat.yaml

fileConfig:
  fileTokenLimit: 100000  # Default: 100,000 tokens

Truncamento significa perda de conteúdo

Se o seu arquivo exceder o limite, o texto será cortado no final. Se você estiver recebendo respostas incompletas, este pode ser o motivo. Você pode aumentar o fileTokenLimit, mas tenha em mente que valores maiores usam mais tokens por mensagem — o que aumenta o custo e pode atingir o limite de contexto do próprio modelo.

Regras gerais:

100k tokens ≈ um livro de 300 páginas (o suficiente para a maioria dos casos de uso)
Se você estiver trabalhando com arquivos muito grandes, considere o File Search (RAG) — ele recupera apenas as seções relevantes em vez de colocar tudo no contexto.

Opcional: impulsionando a extração com OCR

A análise de texto funciona bem para documentos criados digitalmente (PDFs salvos a partir do Word, arquivos de código, texto simples). Mas, se você estiver enviando documentos digitalizados, fotos de páginas ou imagens com texto, o analisador integrado não obterá ótimos resultados.

É aí que o OCR entra em ação. Quando configurado, o LibreChat usa automaticamente o OCR para tipos de arquivo que se beneficiam dele — você não precisa fazer nada diferente como usuário.

Referência de configuração de manipulação de arquivos

Esta seção é para administradores que desejam controlar quais tipos de arquivo são processados por qual método. Os padrões funcionam bem — você só precisa alterar isso se quiser ajustar o comportamento.

Solução de problemas

OCR para Documentos — Configure o reconhecimento óptico de caracteres para imagens e digitalizações
RAG API (Chat with Files) — Busca semântica em grandes coleções de documentos
Agents — File Context — Incorpore o conteúdo de arquivos nas instruções de sistema de um agente
Referência de File Config — Esquema YAML completo para manipulação de arquivos

Fazer upload de arquivos como texto

Fazer upload como texto

Upload para Pesquisa de Arquivos (RAG)

Upload Padrão

Como pedir ao seu administrador para configurar o OCR

Como solicitar ao seu administrador a configuração de STT (para arquivos de áudio)

Exemplo completo de fileConfig

Opção Upload as Text não aparecendo

O conteúdo do arquivo parece incorreto ou está praticamente vazio

A IA parece estar ignorando parte do meu arquivo

Imagens são enviadas, mas a IA não consegue ler o texto nelas

Nesta página