Websuche
Die Websuchfunktion von LibreChat ermöglicht es Ihnen, das Internet zu durchsuchen und relevante Informationen abzurufen, um Ihre Konversationen zu verbessern. Die Funktion besteht aus drei Hauptkomponenten, die zusammenarbeiten, um umfassende Suchergebnisse zu liefern.
Schnelleinstieg
Um mit der Websuche zu beginnen, müssen Sie API-Schlüssel für einen Suchanbieter und einen Scraper konfigurieren. Für das Reranking können Jina oder Cohere verwendet werden, oder es kann mit rerankerType: "none" deaktiviert werden. Sie können dies auf zwei Arten tun:
-
Umgebungsvariablen (Empfohlen für Administratoren):
-
Benutzeroberfläche (Wenn Umgebungsvariablen nicht gesetzt sind):
- Benutzer werden beim ersten Verwenden der Websuchfunktion dazu aufgefordert, die erforderlichen API-Schlüssel einzugeben.
- Sie können wählen, welcher Suchanbieter (Serper, SearXNG oder Tavily) und welcher Reranker-Dienst (Jina, Cohere oder keiner) verwendet werden soll.
Abrufen von API-Keys
Jeder aktivierte externe Dienst erfordert seinen eigenen API-Schlüssel. So erhalten Sie diese:
Suchanbieter
Serper
- Besuchen Sie Serper.dev
- Registrieren Sie sich für ein Konto
- Navigieren Sie zum Abschnitt API Key
- Kopieren Sie Ihren API-Schlüssel
- Legen Sie es in Ihren Umgebungsvariablen fest oder stellen Sie es über die UI bereit
SearXNG
- Befolgen Sie die Einrichtungsanweisungen in der Dokumentation zur Web Search Configuration
- Setze
SEARXNG_INSTANCE_URLauf die URL deiner Instanz - Optional können Sie
SEARXNG_API_KEYfestlegen, falls Ihre Instanz eine Authentifizierung erfordert.
Tavily
- Besuchen Sie Tavily
- Registrieren Sie sich für ein Konto
- Kopieren Sie Ihren API-Schlüssel
- Setzen Sie
TAVILY_API_KEYin Ihren Umgebungsvariablen oder geben Sie ihn über die Benutzeroberfläche ein. - Tavily kann sowohl als Suchanbieter als auch als Scraper-Anbieter verwendet werden.
Scraper: Firecrawl
- Besuchen Sie Firecrawl.dev
- Registrieren Sie sich für ein Konto
- Navigieren Sie zum Abschnitt API Key
- Kopieren Sie Ihren API-Schlüssel
- Legen Sie es in Ihren Umgebungsvariablen fest oder stellen Sie es über die UI bereit
- (Optional) Falls Sie eine benutzerdefinierte Firecrawl-Instanz verwenden, müssen Sie auch die API-URL festlegen
Reranker
Jina
- Besuchen Sie Jina.ai
- Registrieren Sie sich für ein Konto
- Navigieren Sie zum API Dashboard
- Kopieren Sie Ihren API-Schlüssel
- Legen Sie es in Ihren Umgebungsvariablen fest oder stellen Sie es über die UI bereit
Cohere
- Besuchen Sie das Cohere Dashboard
- Registrieren Sie sich für ein Konto
- Navigieren Sie zum Abschnitt API Keys
- Kopieren Sie Ihren API-Schlüssel
- Legen Sie es in Ihren Umgebungsvariablen fest oder stellen Sie es über die UI bereit
Komponenten
1. Suchanbieter
Suchanbieter sind für die Durchführung der anfänglichen Websuche und die Rückgabe relevanter Ergebnisse verantwortlich.
Verfügbare Anbieter:
- Serper: Eine Google Search API, die qualitativ hochwertige Suchergebnisse liefert
- Holen Sie sich Ihren API-Schlüssel von Serper.dev
- SearXNG: Open-Source, selbst gehostete Meta-Suchmaschine
- Hoste deine eigene Instanz selbst
- Datenschutzorientierte Suchergebnisse
- Tavily: KI-optimierte Such-API
- Holen Sie sich Ihren API-Schlüssel von Tavily
- Unterstützt konfigurierbare Suchtiefe, Themenfilterung, Domainfilterung und mehr
- Kann auch als Scraper-Anbieter dienen
2. Scraper
Scraper extrahieren den tatsächlichen Inhalt von Webseiten, die vom Suchanbieter zurückgegeben werden.
Verfügbare Scraper:
-
Firecrawl: Ein leistungsstarker Web-Scraping-Dienst, der Inhalte von Webseiten extrahiert
- Holen Sie sich Ihren API-Schlüssel von Firecrawl.dev
- Die API-URL ist optional (standardmäßig wird der gehostete Dienst von Firecrawl verwendet)
-
Tavily: Batch-URL-Extraktion über die Tavily Extract API
- Verwendet denselben
TAVILY_API_KEYwie der Suchanbieter - Unterstützt konfigurierbare Extraktionstiefe, Bildextraktion und Favicon-Extraktion
- Verwendet denselben
Geplante Scraper:
- Local Firecrawl: Selbstgehostete Version von Firecrawl
- Zusätzliche Scraping-Dienste von Drittanbietern
3. Reranker
Reranker analysieren die gescrapten Inhalte, um die relevantesten Teile zu bestimmen und sie für bessere Ergebnisse neu anzuordnen.
Verfügbare Reranker:
- Jina: KI-gestützter Reranking-Dienst
- Holen Sie sich Ihren API-Schlüssel von Jina.ai
- Die API URL ist optional (standardmäßig wird der gehostete Dienst von Jina verwendet)
- Cohere: Fortschrittlicher Reranking-Dienst
- Holen Sie sich Ihren API-Schlüssel vom Cohere Dashboard
- None: Überspringt das Reranking, wenn
rerankerTypeauf"none"gesetzt ist.
Geplante Reranker:
- RAG API: Open-Source-Reranking mittels RAG (Retrieval-Augmented Generation)
- Zusätzliche Reranking-Dienste von Drittanbietern
Konfiguration
Admin-Konfiguration
Admins können die Websuchfunktion mithilfe von Umgebungsvariablen konfigurieren. Die YAML-Konfiguration ermöglicht es Ihnen, benutzerdefinierte Namen für Umgebungsvariablen für jede Komponente festzulegen.
⚠️ Wichtig: Geben Sie niemals tatsächliche API-Schlüssel oder Werte in die YAML-Datei ein (sie werden nicht funktionieren) – verwenden Sie nur die Namen der Umgebungsvariablen.
Hinweis: Die YAML-Konfiguration sollte nur Umgebungsvariablennamen (im Format ${VARIABLE_NAME}) enthalten. Diese Flexibilität ermöglicht:
- Verwendung unterschiedlicher Variablennamen in verschiedenen Umgebungen
- Unterstützung mehrerer Konfigurationen für verschiedene Benutzergruppen
- Zukünftige Integration mit rollenbasierten Konfigurationen
Wenn Sie das System darauf beschränken möchten, nur bestimmte Dienste zu verwenden, können Sie die Diensttypen angeben:
Benutzerkonfiguration
Wenn der Administrator nicht alle erforderlichen API-Schlüssel konfiguriert hat, werden Benutzer dazu aufgefordert, diese über die Benutzeroberfläche einzugeben. Die Oberfläche ermöglicht es Benutzern:
- Wählen Sie ihren bevorzugten Reranker (Jina, Cohere oder keiner)
- Geben Sie die API-Schlüssel für die erforderlichen Dienste ein
- Konfigurieren Sie bei Bedarf die Firecrawl API-URL (optional)
- Konfigurieren Sie bei Bedarf die Jina API-URL (optional)
- Konfigurieren Sie bei Bedarf die Tavily Search- oder Extract-API-URLs (optional)
Verwendung
Sobald die Konfiguration abgeschlossen ist, können Sie die Websuche auf zwei Arten nutzen:
- Chat-Oberfläche: Klicken Sie auf die Websuch-Schaltfläche in der Chat-Oberfläche, um die Websuche für Ihre Unterhaltung zu aktivieren.
- Agents: Verwenden Sie die
web_search-Funktion in Agents, um ihnen die Suche im Web zu ermöglichen
Hinweise
- Die Konfiguration für Suchanbieter und Scraper ist erforderlich; das Reranking kann mit
rerankerType: "none"deaktiviert werden. - Die Firecrawl API URL ist optional und verwendet standardmäßig deren gehosteten Dienst.
- Die Jina API-URL ist optional und verwendet standardmäßig deren gehosteten Dienst.
- Die Tavily Search and Extract API URLs sind optional und verwenden standardmäßig die gehosteten Dienste von Tavily.
- Safe Search bietet drei Stufen der Inhaltsfilterung: OFF (0), MODERATE (1 - Standard) und STRICT (2)
- Tavily übernimmt standardmäßig nicht die globale
safeSearch-Einstellung; verwenden SietavilySearchOptions.safeSearchnur, wenn Ihr Tavily-Kontosafe_searchunterstützt. - Das Scraper-Timeout ist standardmäßig auf 7,5 Sekunden (7500ms) eingestellt.
- API-Schlüssel können jederzeit über die Benutzeroberfläche widerrufen werden.
- Zukünftige Updates werden weitere Open-Source- und selbst gehostete Optionen für alle Komponenten enthalten.
- Weitere Anpassungsoptionen sind geplant, darunter:
- Kontrolle über die Anzahl der zu scrappenden Links
- Domain-Allowlist/Blocklist für Scraping
- Benutzerdefinierte Scraping-Regeln und Filter
- Erweiterte Optionen für Ergebnisfilterung und Ranking
- Steuerung von Ratenbegrenzung und Anforderungsdrosselung
Wie finden Sie diese Anleitung?