Subir archivos como texto
Arrastra cualquier archivo a tu chat y deja que LibreChat lo lea; no se requiere configuración.
Cargar archivos como texto
¿Alguna vez has querido entregarle un PDF, un archivo de código o una hoja de cálculo a la IA y simplemente decirle "lee esto"? Eso es exactamente lo que hace Upload as Text.
Adjuntas un archivo, LibreChat extrae el texto del mismo y el contenido completo se pega directamente en tu conversación. La IA puede leer cada palabra del mismo; sin plugins, sin bases de datos vectoriales, sin servicios adicionales que configurar. Funciona de inmediato.
No requiere configuración
Upload as Text funciona inmediatamente en cualquier instancia de LibreChat. Utiliza un análisis de texto integrado; no necesitas OCR, una canalización RAG ni ningún servicio externo para comenzar.
Cómo usarlo
Haz clic en el icono de adjuntar
En la barra de entrada del chat, haz clic en el icono del clip (📎).
Selecciona "Upload as Text"
Desde el menú desplegable, selecciona Upload as Text. Esto le indica a LibreChat que lea el contenido del archivo en lugar de pasarlo como un archivo adjunto sin procesar.
Elige tu archivo
Selecciona el archivo desde tu dispositivo. LibreChat extraerá el texto y lo insertará directamente en tu mensaje.
Haz tu pregunta
Escribe tu prompt como de costumbre. La IA ahora tiene el texto completo de tu archivo en contexto y puede hacer referencia a cualquier parte del mismo.
¿No ves la opción?
Si "Upload as Text" no aparece, es posible que la capacidad context haya sido desactivada por su administrador. Está activada de forma predeterminada, pero si la lista de capacidades fue personalizada, context debe incluirse explícitamente. Consulte la sección de configuración a continuación.
Qué sucede bajo el capó
Cuando subes un archivo de esta manera, LibreChat no solo vuelca bytes sin procesar en el prompt. Pasa por una canalización de procesamiento para extraer texto limpio y legible:
- Detección de tipo MIME — LibreChat verifica qué tipo de archivo has subido (PDF, imagen, audio, código fuente, etc.) inspeccionando su tipo MIME.
- Selección de método — Según el tipo de archivo y los servicios disponibles, elige el mejor método de extracción utilizando esta prioridad:
| Prioridad | Método | Cuándo se utiliza |
|---|---|---|
| 1.ª | OCR | El archivo es una imagen o un documento escaneado, y el OCR está configurado |
| 2.ª | STT (Speech-to-Text) | El archivo es audio, y el STT está configurado |
| 3.ª | Análisis de texto | El archivo coincide con un tipo MIME de texto conocido |
| 4.ª | Reserva (Fallback) | Ninguna de las anteriores coincidió — intenta el análisis de texto de todos modos |
- Truncamiento de tokens — El texto extraído se recorta al
fileTokenLimit(predeterminado: 100,000 tokens) para que no exceda la ventana de contexto del modelo. - Inyección de prompts — El texto se incluye en el contexto de la conversación, justo al lado de su mensaje.
¿Qué archivos son compatibles
Estos se analizan directamente; ya son texto, por lo que no se necesita conversión.
- Texto plano (
.txt), Markdown (.md), CSV, JSON, XML, HTML, CSS - Lenguajes de programación — Python, JavaScript, TypeScript, Java, C#, PHP, Ruby, Go, Rust, Kotlin, Swift, Scala, Perl, Lua
- Archivos de configuración — YAML, TOML, INI
- Scripts de shell, archivos SQL
Cargar como texto vs. otras opciones de carga
LibreChat tiene tres formas de subir archivos. Cada una funciona de manera diferente y se adapta a distintas situaciones:
Subir como texto
Extrae el contenido completo del archivo y lo coloca en la conversación. Es ideal para archivos más pequeños donde deseas que la IA lea todo: contratos, archivos de código, artículos. Funciona con todos los modelos, sin necesidad de servicios adicionales.
Carga para búsqueda de archivos (RAG)
Indexa el archivo en una base de datos vectorial y recupera solo los fragmentos relevantes cuando haces una pregunta. Es mejor para archivos grandes o colecciones de archivos donde incluir todo en el contexto desperdiciaría tokens. Requiere la RAG API.
Carga estándar
Pasa el archivo directamente al modelo; se utiliza para modelos de visión que analizan imágenes o para el intérprete de código que ejecuta scripts. No se realiza ninguna extracción de texto.
Guía de decisión rápida:
| Situación | Mejor opción |
|---|---|
| "Lee este contrato de 5 páginas y resúmelo" | Cargar como texto |
| "Tengo 50 archivos PDF, busca qué menciona sobre precios" | Búsqueda de archivos (RAG) |
| "¿Qué hay en esta captura de pantalla?" (modelo de visión) | Carga estándar |
| "Ejecuta este script de Python" (intérprete de código) | Carga estándar |
| "Revisa este archivo de código en busca de errores" | Cargar como texto |
| "Busca en nuestros documentos de la empresa" | Búsqueda de archivos (RAG) |
La capacidad context
Internamente, Upload as Text funciona mediante la capacidad context. Esto es lo que controla si la función aparece en tu interfaz de chat.
La capacidad context está habilitada de forma predeterminada. Solo necesitas modificar esto si tu administrador ha personalizado la lista de capacidades y la ha omitido accidentalmente.
La misma capacidad de context también impulsa el Agent File Context (subir archivos a través del Agent Builder para incrustar texto en las instrucciones del sistema de un agente). La diferencia es dónde termina el texto:
| Cargar como texto | Contexto de archivo del agente | |
|---|---|---|
| Dónde | Entrada de chat (cualquier conversación) | Panel del Creador de agentes |
| Alcance | Solo la conversación actual | Persiste en las instrucciones del agente |
| Caso de uso | Preguntas sobre documentos puntuales | Creación de agentes especializados con conocimiento integrado |
Límites de tokens y truncamiento
Cuando un archivo es demasiado largo para caber en la ventana de contexto del modelo, LibreChat trunca el texto extraído para mantenerse dentro de los límites. Esto sucede automáticamente; no necesita preocuparse por ello, pero es bueno saber cómo funciona.
El truncamiento significa contenido perdido
Si tu archivo excede el límite, el texto se corta al final. Si estás obteniendo respuestas incompletas, esta podría ser la razón. Puedes aumentar fileTokenLimit, pero ten en cuenta que valores más grandes utilizan más tokens por mensaje, lo cual aumenta el costo y puede alcanzar el límite de contexto del propio modelo.
Reglas generales:
- 100k tokens ≈ un libro de 300 páginas (suficiente para la mayoría de los casos de uso)
- Si estás trabajando con archivos muy grandes, considera File Search (RAG) en su lugar; esto solo recupera las secciones relevantes en lugar de incluir todo en el contexto.
Opcional: mejorar la extracción con OCR
El análisis de texto funciona bien para documentos creados digitalmente (PDF guardados desde Word, archivos de código, texto sin formato). Pero si vas a subir documentos escaneados, fotos de páginas o imágenes con texto, el analizador integrado no obtendrá resultados óptimos.
Ahí es donde entra en juego el OCR. Cuando está configurado, LibreChat utiliza automáticamente OCR para los tipos de archivo que se benefician de ello; no necesitas hacer nada diferente como usuario.
Referencia de configuración de manejo de archivos
Esta sección es para administradores que desean controlar qué tipos de archivos son procesados por qué método. Los valores predeterminados funcionan bien; solo necesita modificar esto si desea ajustar el comportamiento.
Solución de problemas
Relacionado
- OCR para documentos — Configura el reconocimiento óptico de caracteres para imágenes y escaneos
- RAG API (Chat with Files) — Búsqueda semántica sobre grandes colecciones de documentos
- Agents — File Context — Incrustar el contenido de un archivo en las instrucciones del sistema de un agente
- Referencia de File Config — Esquema YAML completo para el manejo de archivos
¿Qué te parece esta guía?