Recherche Web
La fonctionnalité de recherche web de LibreChat vous permet d'effectuer des recherches sur Internet et de récupérer des informations pertinentes pour enrichir vos conversations. Cette fonctionnalité se compose de trois éléments principaux qui fonctionnent ensemble pour fournir des résultats de recherche complets.
Démarrage rapide
Pour commencer avec la recherche web, vous devrez configurer des clĂ©s API pour un fournisseur de recherche et un scraper. Le reranking peut utiliser Jina ou Cohere, ou ĂȘtre dĂ©sactivĂ© avec rerankerType: "none". Vous pouvez le faire de deux maniĂšres :
-
Variables d'environnement (Recommandé pour les administrateurs) :
-
Interface utilisateur (Si les variables d'environnement ne sont pas définies) :
- Les utilisateurs seront invités à saisir les clés API requises lors de leur premiÚre utilisation de la fonctionnalité de recherche web.
- Ils peuvent choisir quel fournisseur de recherche (Serper, SearXNG ou Tavily) et quel service de reranking utiliser (Jina, Cohere ou aucun).
Obtention des clés API
Chaque service externe activé nécessite sa propre clé API. Voici comment les obtenir :
Fournisseurs de recherche
Serper
- Visitez Serper.dev
- Créer un compte
- Accédez à la section API Key
- Copiez votre clé API
- Définissez-le dans vos variables d'environnement ou fournissez-le via l'interface utilisateur
SearXNG
- Suivez les instructions de configuration dans la documentation Web Search Configuration
- Définissez
SEARXNG_INSTANCE_URLsur l'URL de votre instance - Définissez éventuellement
SEARXNG_API_KEYsi votre instance nécessite une authentification
Tavily
- Visitez Tavily
- Créer un compte
- Copiez votre clé API
- Définissez
TAVILY_API_KEYdans vos variables d'environnement ou fournissez-la via l'interface utilisateur - Tavily peut ĂȘtre utilisĂ© Ă la fois comme fournisseur de recherche et comme fournisseur de scraping.
Scraper : Firecrawl
- Visitez Firecrawl.dev
- Créer un compte
- Accédez à la section API Key
- Copiez votre clé API
- Définissez-le dans vos variables d'environnement ou fournissez-le via l'interface utilisateur
- (Facultatif) Si vous utilisez une instance Firecrawl personnalisée, vous devrez également définir l'URL de l'API
Rerankers
Jina
- Visitez Jina.ai
- Créer un compte
- Accédez au tableau de bord de l'API
- Copiez votre clé API
- Définissez-le dans vos variables d'environnement ou fournissez-le via l'interface utilisateur
Cohere
- Visitez le Cohere Dashboard
- Créer un compte
- Accédez à la section API Keys
- Copiez votre clé API
- Définissez-le dans vos variables d'environnement ou fournissez-le via l'interface utilisateur
Composants
1. Fournisseurs de recherche
Les fournisseurs de recherche sont responsables d'effectuer la recherche web initiale et de renvoyer les résultats pertinents.
Fournisseurs disponibles :
- Serper : Une API de recherche Google qui fournit des résultats de recherche de haute qualité
- Obtenez votre clé API sur Serper.dev
- SearXNG : Méta-moteur de recherche open-source et auto-hébergé
- Auto-hébergez votre propre instance
- Résultats de recherche axés sur la confidentialité
- Tavily : API de recherche optimisée pour l'IA
- Obtenez votre clé API depuis Tavily
- Prend en charge une profondeur de recherche configurable, le filtrage par sujet, le filtrage par domaine, et plus encore.
- Peut également servir de fournisseur de scraper
2. Scrapers
Les scrapers extraient le contenu réel des pages web renvoyées par le fournisseur de recherche.
Scrapers disponibles :
-
Firecrawl : Un service de web scraping puissant qui extrait le contenu des pages web
- Obtenez votre clé API sur Firecrawl.dev
- L'URL de l'API est facultative (par défaut, il s'agit du service hébergé de Firecrawl)
-
Tavily : Extraction d'URL par lots via l'API Tavily Extract
- Utilise la mĂȘme
TAVILY_API_KEYque le fournisseur de recherche - Prend en charge la profondeur d'extraction configurable, l'extraction d'images et l'extraction de favicon
- Utilise la mĂȘme
Scrapers prévus :
- Local Firecrawl : Version auto-hébergée de Firecrawl
- Services de scraping tiers supplémentaires
3. Rerankers
Les Rerankers analysent le contenu extrait pour déterminer les parties les plus pertinentes et les réorganiser afin d'obtenir de meilleurs résultats.
Rerankers disponibles :
- Jina : service de reranking alimenté par l'IA
- Obtenez votre clé API sur Jina.ai
- L'URL de l'API est facultative (par défaut, il s'agit du service hébergé de Jina)
- Cohere : Service de reranking avancé
- Obtenez votre clé API depuis le Cohere Dashboard
- None : Ignore le reranking lorsque
rerankerTypeest défini sur"none"
Rerankers prévus :
- RAG API : Reranking open-source utilisant RAG (Retrieval-Augmented Generation)
- Services de reranking tiers supplémentaires
Configuration
Configuration administrateur
Les administrateurs peuvent configurer la fonctionnalité de recherche web à l'aide de variables d'environnement. La configuration YAML vous permet de spécifier des noms de variables d'environnement personnalisés pour chaque composant.
â ïž Important : Ne mettez jamais de clĂ©s API ou de valeurs rĂ©elles dans le fichier YAML (elles ne fonctionneront pas) - utilisez uniquement les noms des variables d'environnement.
Note : La configuration YAML ne doit contenir que des noms de variables d'environnement (au format ${VARIABLE_NAME}). Cette flexibilité permet :
- Utilisation de noms de variables différents dans des environnements différents
- Prise en charge de plusieurs configurations pour différents groupes d'utilisateurs
- Intégration future avec des configurations basées sur les rÎles
Si vous souhaitez restreindre le systÚme à l'utilisation de services spécifiques uniquement, vous pouvez spécifier les types de services :
Configuration utilisateur
Si l'administrateur n'a pas configuré toutes les clés API nécessaires, les utilisateurs seront invités à les fournir via l'interface utilisateur. L'interface permet aux utilisateurs de :
- Choisissez leur reranker préféré (Jina, Cohere, ou aucun)
- Saisissez les clés API pour les services requis
- Configurez l'URL de l'API Firecrawl si nécessaire (optionnel)
- Configurez l'URL de l'API Jina si nécessaire (optionnel)
- Configurez les URLs de l'API Tavily Search ou Extract si nécessaire (optionnel)
Utilisation
Une fois configuré, vous pouvez utiliser la recherche web de deux maniÚres :
- Interface de chat : Cliquez sur le bouton de recherche web dans l'interface de chat pour activer la recherche web pour votre conversation
- Agents : Utilisez la fonctionnalité
web_searchdans les agents pour leur permettre d'effectuer des recherches sur le web
Notes
- La configuration du fournisseur de recherche et du scraper est requise ; le reranking peut ĂȘtre dĂ©sactivĂ© avec
rerankerType: "none" - L'URL de l'API Firecrawl est facultative et utilise par défaut leur service hébergé.
- L'URL de l'API Jina est facultative et utilise par défaut leur service hébergé.
- Les URLs de l'API Tavily Search and Extract sont facultatives et utilisent par défaut les services hébergés de Tavily.
- La recherche sécurisée (Safe search) propose trois niveaux de filtrage de contenu : OFF (0), MODERATE (1 - par défaut) et STRICT (2)
- Tavily n'hérite pas du paramÚtre global
safeSearchpar défaut ; utiliseztavilySearchOptions.safeSearchuniquement si votre compte Tavily prend en chargesafe_search. - Le délai d'expiration du scraper est défini par défaut sur 7,5 secondes (7500ms).
- Les clĂ©s API peuvent ĂȘtre rĂ©voquĂ©es Ă tout moment via l'interface utilisateur.
- Les futures mises à jour incluront davantage d'options open-source et auto-hébergées pour tous les composants
- D'autres options de personnalisation sont prévues, notamment :
- ContrĂŽle sur le nombre de liens Ă scraper
- Liste blanche/liste noire de domaines pour le scraping
- RÚgles de scraping et filtres personnalisés
- Options avancées de filtrage et de classement des résultats
- ContrĂŽles de limitation de dĂ©bit et de rĂ©gulation des requĂȘtes
Que pensez-vous de ce guide ?