Fazer upload de arquivos como texto
Solte qualquer arquivo no seu chat e deixe o LibreChat lê-lo — nenhuma configuração necessária.
Fazer upload de arquivos como texto
Já quis entregar um PDF, um arquivo de código ou uma planilha para a IA e simplesmente dizer "leia isto"? É exatamente isso que o Upload as Text faz.
Você anexa um arquivo, o LibreChat extrai o texto dele e o conteúdo completo é colado diretamente na sua conversa. A IA pode então ler cada palavra dele — sem plugins, sem bancos de dados vetoriais, sem serviços extras para configurar. Funciona nativamente.
Nenhuma configuração necessária
Upload as Text funciona imediatamente em qualquer instância do LibreChat. Ele utiliza análise de texto integrada — você não precisa de OCR, um pipeline de RAG ou qualquer serviço externo para começar.
Como usar
Clique no ícone de anexo
Na barra de entrada de chat, clique no ícone de clipe de papel (📎).
Escolha "Upload as Text"
No menu suspenso, selecione Upload as Text. Isso instrui o LibreChat a ler o conteúdo do arquivo em vez de enviá-lo como um anexo bruto.
Escolha seu arquivo
Selecione o arquivo do seu dispositivo. O LibreChat extrairá o texto e o incorporará diretamente na sua mensagem.
Faça sua pergunta
Digite seu prompt como de costume. A IA agora tem o texto completo do seu arquivo no contexto e pode referenciar qualquer parte dele.
Não vê a opção?
Se "Upload as Text" não aparecer, a capacidade context pode ter sido desativada pelo seu administrador. Ela está ativada por padrão — mas se a lista de capacidades foi personalizada, context precisa ser incluído explicitamente. Veja a seção de configuração abaixo.
O que acontece nos bastidores
Quando você faz upload de um arquivo desta forma, o LibreChat não apenas despeja bytes brutos no prompt. Ele executa um pipeline de processamento para extrair texto limpo e legível:
- Detecção de tipo MIME — O LibreChat verifica que tipo de arquivo você enviou (PDF, imagem, áudio, código-fonte, etc.) inspecionando seu tipo MIME.
- Seleção de método — Com base no tipo de arquivo e nos serviços disponíveis, ele escolhe o melhor método de extração usando esta prioridade:
| Prioridade | Método | Quando é usado |
|---|---|---|
| 1ª | OCR | O arquivo é uma imagem ou documento digitalizado, e o OCR está configurado |
| 2ª | STT (Speech-to-Text) | O arquivo é áudio, e o STT está configurado |
| 3ª | Análise de texto | O arquivo corresponde a um tipo MIME de texto conhecido |
| 4ª | Fallback | Nenhum dos anteriores correspondeu — tenta a análise de texto de qualquer maneira |
Um .pdf em uma instância com OCR configurado:
→ O OCR é ativado. Ótimo para documentos digitalizados e layouts complexos.
Um .pdf em uma instância padrão (sem OCR):
→ O processamento de texto lida com isso. Funciona bem para PDFs criados digitalmente.
Um arquivo Python .py:
→ Direto para a análise de texto. O código-fonte já é texto — nenhuma conversão é necessária.
Um .mp3 em uma instância com STT configurado:
→ Speech-to-Text transcreve-o em texto para a conversa.
Uma captura de tela .png sem OCR configurado:
→ Recorre à análise de texto (resultados limitados — considere configurar o OCR para imagens).
- Truncamento de tokens — O texto extraído é cortado de acordo com o
fileTokenLimit(padrão: 100.000 tokens) para que não exceda a janela de contexto do modelo. - Prompt injection — O texto é incluído no contexto da conversa, exatamente ao lado da sua mensagem.
Quais arquivos são suportados
Estes são analisados diretamente — eles já são texto, portanto, nenhuma conversão é necessária.
- Texto simples (
.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS - Linguagens de programação — Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
- Arquivos de configuração — YAML, TOML, INI
- Scripts de shell, arquivos SQL
A análise de texto lida com isso nativamente. Se o OCR estiver configurado, ele assume o controle para obter melhor precisão em layouts complexos.
- PDF — digital e digitalizado (PDFs digitalizados se beneficiam de OCR)
- Word —
.docx,.doc - PowerPoint —
.pptx,.ppt - Excel —
.xlsx,.xls - Livros EPUB
Imagens exigem OCR para produzir texto útil. Sem isso, os resultados serão insatisfatórios.
- JPEG, PNG, GIF, WebP
- HEIC, HEIF (formatos da Apple)
- Capturas de tela, fotos de documentos, páginas digitalizadas
Arquivos de áudio exigem que o STT esteja configurado. Não há fallback — o áudio não pode ser "analisado como texto".
- MP3, WAV, OGG, FLAC
- M4A, WebM
- Gravações de voz, clipes de podcast
Upload como texto vs. outras opções de upload
O LibreChat possui três maneiras de fazer upload de arquivos. Cada uma funciona de forma diferente e se adapta a situações distintas:
Fazer upload como texto
Extrai o conteúdo completo do arquivo e o insere na conversa. Ideal para arquivos menores onde você deseja que a IA leia tudo — contratos, arquivos de código, artigos. Funciona com todos os modelos, sem necessidade de serviços adicionais.
Upload para Pesquisa de Arquivos (RAG)
Indexa o arquivo em um banco de dados vetorial e recupera apenas os trechos relevantes quando você faz uma pergunta. Melhor para arquivos grandes ou coleções de arquivos onde despejar tudo no contexto desperdiçaria tokens. Requer a RAG API.
Upload Padrão
Passa o arquivo diretamente para o modelo — usado para modelos de visão que analisam imagens, ou para o interpretador de código que executa scripts. Nenhuma extração de texto é realizada.
Guia de decisão rápida:
| Situação | Melhor opção |
|---|---|
| "Leia este contrato de 5 páginas e resuma-o" | Upload as Text |
| "Tenho 50 PDFs, encontre o que menciona preços" | File Search (RAG) |
| "O que há nesta captura de tela?" (modelo de visão) | Standard Upload |
| "Execute este script Python" (interpretador de código) | Standard Upload |
| "Revise este arquivo de código em busca de bugs" | Upload as Text |
| "Pesquise em nossos documentos da empresa" | File Search (RAG) |
A capacidade context
Por baixo dos panos, o Upload as Text é alimentado pela capacidade context. É isso que controla se o recurso aparece na sua interface de chat.
A funcionalidade context está habilitada por padrão. Você só precisa alterar isso se o seu administrador tiver personalizado a lista de funcionalidades e a tiver removido acidentalmente.
endpoints:
agents:
capabilities:
- "context" # This is what enables "Upload as Text"A mesma funcionalidade de context também impulsiona o Agent File Context (upload de arquivos através do Agent Builder para incorporar texto nas instruções de sistema de um agente). A diferença é onde o texto termina:
| Upload as Text | Agent File Context | |
|---|---|---|
| Onde | Entrada de chat (qualquer conversa) | Painel do Agent Builder |
| Escopo | Apenas a conversa atual | Persiste nas instruções do agente |
| Caso de uso | Perguntas pontuais sobre documentos | Criação de agentes especializados com conhecimento integrado |
Limites de tokens e truncamento
Quando um arquivo é longo demais para caber na janela de contexto do modelo, o LibreChat trunca o texto extraído para permanecer dentro dos limites. Isso acontece automaticamente — você não precisa se preocupar com isso, mas é bom saber como funciona.
fileConfig:
fileTokenLimit: 100000 # Default: 100,000 tokensTruncamento significa perda de conteúdo
Se o seu arquivo exceder o limite, o texto será cortado no final. Se você estiver recebendo respostas incompletas, este pode ser o motivo. Você pode aumentar o fileTokenLimit, mas tenha em mente que valores maiores usam mais tokens por mensagem — o que aumenta o custo e pode atingir o limite de contexto do próprio modelo.
Regras gerais:
- 100k tokens ≈ um livro de 300 páginas (o suficiente para a maioria dos casos de uso)
- Se você estiver trabalhando com arquivos muito grandes, considere o File Search (RAG) — ele recupera apenas as seções relevantes em vez de colocar tudo no contexto.
Opcional: impulsionando a extração com OCR
A análise de texto funciona bem para documentos criados digitalmente (PDFs salvos a partir do Word, arquivos de código, texto simples). Mas, se você estiver enviando documentos digitalizados, fotos de páginas ou imagens com texto, o analisador integrado não obterá ótimos resultados.
É aí que o OCR entra em ação. Quando configurado, o LibreChat usa automaticamente o OCR para tipos de arquivo que se beneficiam dele — você não precisa fazer nada diferente como usuário.
Referência de configuração de manipulação de arquivos
Esta seção é para administradores que desejam controlar quais tipos de arquivo são processados por qual método. Os padrões funcionam bem — você só precisa alterar isso se quiser ajustar o comportamento.
Solução de problemas
Relacionado
- OCR para Documentos — Configure o reconhecimento óptico de caracteres para imagens e digitalizações
- RAG API (Chat with Files) — Busca semântica em grandes coleções de documentos
- Agents — File Context — Incorpore o conteúdo de arquivos nas instruções de sistema de um agente
- Referência de File Config — Esquema YAML completo para manipulação de arquivos
Como está este guia?
API de RAG (Conversar com Arquivos)
API de Retrieval-Augmented Generation (RAG) para indexação e recuperação de documentos usando Langchain e FastAPI. Esta API integra-se ao LibreChat para fornecer respostas com reconhecimento de contexto baseadas em arquivos enviados pelo usuário.
OCR para Documentos
Aprenda a configurar o Reconhecimento Óptico de Caracteres (OCR) para aprimorar a extração de texto nos recursos de upload de arquivos do LibreChat.