Búsqueda web
La función de búsqueda web de LibreChat le permite buscar en internet y recuperar información relevante para mejorar sus conversaciones. La función consta de tres componentes principales que trabajan juntos para proporcionar resultados de búsqueda exhaustivos.
Inicio rápido
Para comenzar con la búsqueda web, necesitarás configurar las claves de API para un proveedor de búsqueda y un scraper. La reordenación (reranking) puede utilizar Jina o Cohere, o puede desactivarse con rerankerType: "none". Puedes hacerlo de dos maneras:
-
Variables de entorno (Recomendado para administradores):
-
Interfaz de usuario (Si las variables de entorno no están configuradas):
- Se pedirá a los usuarios que ingresen las claves de API requeridas cuando utilicen la función de búsqueda web por primera vez.
- Pueden elegir qué proveedor de búsqueda (Serper, SearXNG o Tavily) y qué servicio de reranker utilizar (Jina, Cohere o ninguno)
Obtención de API Keys
Cada servicio externo habilitado requiere su propia clave API. Aquí te explicamos cómo obtenerlas:
Proveedores de búsqueda
Serper
- Visita Serper.dev
- Regístrate para obtener una cuenta
- Navega a la sección de API Key
- Copia tu clave de API
- Configúralo en tus variables de entorno o proporciónalo a través de la interfaz de usuario
SearXNG
- Siga las instrucciones de configuración en la documentación de Web Search Configuration
- Establezca
SEARXNG_INSTANCE_URLen la URL de su instancia - Opcionalmente, configure
SEARXNG_API_KEYsi su instancia requiere autenticación
Tavily
- Visita Tavily
- Regístrate para obtener una cuenta
- Copia tu clave de API
- Configure
TAVILY_API_KEYen sus variables de entorno o proporciónela a través de la interfaz de usuario - Tavily puede utilizarse tanto como proveedor de búsqueda como proveedor de scraping.
Scraper: Firecrawl
- Visita Firecrawl.dev
- Regístrate para obtener una cuenta
- Navega a la sección de API Key
- Copia tu clave de API
- Configúralo en tus variables de entorno o proporciónalo a través de la interfaz de usuario
- (Opcional) Si está utilizando una instancia personalizada de Firecrawl, también deberá configurar la API URL
Rerankers
Jina
- Visita Jina.ai
- Regístrate para obtener una cuenta
- Navega al API Dashboard
- Copia tu clave de API
- Configúralo en tus variables de entorno o proporciónalo a través de la interfaz de usuario
Cohere
- Visita el Cohere Dashboard
- Regístrate para obtener una cuenta
- Navegue a la sección de API Keys
- Copia tu clave de API
- Configúralo en tus variables de entorno o proporciónalo a través de la interfaz de usuario
Componentes
1. Proveedores de búsqueda
Los proveedores de búsqueda son responsables de realizar la búsqueda web inicial y devolver resultados relevantes.
Proveedores disponibles:
- Serper: Una API de búsqueda de Google que proporciona resultados de búsqueda de alta calidad
- Obtén tu clave de API en Serper.dev
- SearXNG: Motor de búsqueda meta de código abierto y autohospedado
- Autohospeda tu propia instancia
- Resultados de búsqueda centrados en la privacidad
- Tavily: API de búsqueda optimizada para IA
- Obtén tu clave de API desde Tavily
- Admite profundidad de búsqueda configurable, filtrado de temas, filtrado de dominios y más
- También puede servir como proveedor de scraper
2. Scrapers
Los scrapers extraen el contenido real de las páginas web devueltas por el proveedor de búsqueda.
Scrapers disponibles:
-
Firecrawl: Un potente servicio de web scraping que extrae contenido de páginas web
- Obtén tu clave de API en Firecrawl.dev
- La API URL es opcional (por defecto utiliza el servicio alojado de Firecrawl)
-
Tavily: Extracción por lotes de URL a través de la API de Tavily Extract
- Utiliza la misma
TAVILY_API_KEYque el proveedor de búsqueda - Admite profundidad de extracción configurable, extracción de imágenes y extracción de favicon.
- Utiliza la misma
Scrapers planificados:
- Local Firecrawl: Versión autohospedada de Firecrawl
- Servicios de scraping de terceros adicionales
3. Rerankers
Los Rerankers analizan el contenido extraído para determinar las partes más relevantes y reordenarlas para obtener mejores resultados.
Rerankers disponibles:
- Jina: Servicio de reranking impulsado por IA
- Obtén tu clave de API en Jina.ai
- La API URL es opcional (por defecto utiliza el servicio alojado de Jina)
- Cohere: Servicio avanzado de reranking
- Obtén tu clave de API desde el Cohere Dashboard
- None: Omite la reclasificación cuando
rerankerTypeestá configurado en"none"
Rerankers planificados:
- RAG API: Reranking de código abierto utilizando RAG (Generación Aumentada por Recuperación)
- Servicios de reordenamiento (reranking) de terceros adicionales
Configuración
Configuración de administrador
Los administradores pueden configurar la función de búsqueda web utilizando variables de entorno. La configuración YAML le permite especificar nombres de variables de entorno personalizados para cada componente.
⚠️ Importante: Nunca coloque claves de API reales o valores en el archivo YAML (no funcionarán); utilice únicamente nombres de variables de entorno.
Nota: La configuración YAML solo debe contener nombres de variables de entorno (en el formato ${VARIABLE_NAME}). Esta flexibilidad permite:
- Uso de diferentes nombres de variables en diferentes entornos
- Admitir múltiples configuraciones para diferentes grupos de usuarios
- Integración futura con configuraciones basadas en roles
Si desea restringir el sistema para que utilice solo servicios específicos, puede especificar los tipos de servicio:
Configuración de usuario
Si el administrador no ha configurado todas las claves de API necesarias, se solicitará a los usuarios que las proporcionen a través de la interfaz de usuario. La interfaz permite a los usuarios:
- Elija su reranker preferido (Jina, Cohere o ninguno)
- Ingrese las API keys para los servicios requeridos
- Configure la URL de la API de Firecrawl si es necesario (opcional)
- Configure la URL de la API de Jina si es necesario (opcional)
- Configure las URLs de Tavily Search o Extract API si es necesario (opcional)
Uso
Una vez configurado, puedes usar la búsqueda web de dos maneras:
- Interfaz de chat: Haga clic en el botón de búsqueda web en la interfaz de chat para habilitar la búsqueda web para su conversación
- Agents: Utilice la capacidad
web_searchen los agents para permitirles realizar búsquedas en la web
Notas
- La configuración del proveedor de búsqueda y del scraper es obligatoria; la reclasificación (reranking) puede desactivarse con
rerankerType: "none" - La URL de la API de Firecrawl es opcional y utiliza el servicio alojado por defecto.
- La URL de la API de Jina es opcional y utiliza el servicio alojado por defecto.
- Las URLs de la API de búsqueda y extracción de Tavily son opcionales y utilizan por defecto los servicios alojados de Tavily.
- La búsqueda segura ofrece tres niveles de filtrado de contenido: OFF (0), MODERATE (1 - predeterminado) y STRICT (2)
- Tavily no hereda la configuración global
safeSearchde forma predeterminada; utilicetavilySearchOptions.safeSearchsolo si su cuenta de Tavily admitesafe_search - El tiempo de espera del scraper está configurado en 7.5 segundos (7500ms) de forma predeterminada.
- Las API keys pueden ser revocadas en cualquier momento a través de la UI
- Las futuras actualizaciones incluirán más opciones de código abierto y autohospedadas para todos los componentes
- Se planean opciones de personalización adicionales, incluyendo:
- Control sobre el número de enlaces a extraer
- Lista de permitidos/lista de bloqueados de dominios para scraping
- Reglas y filtros de scraping personalizados
- Opciones avanzadas de filtrado y clasificación de resultados
- Controles de limitación de tasa y regulación de solicitudes
¿Qué te parece esta guía?