vLLM
Konfigurieren Sie vLLM als benutzerdefinierten endpoint in LibreChat.
vLLM ist eine leistungsstarke, speichereffiziente Inferenz- und Serving-Engine für LLMs. Sie stellt eine OpenAI-kompatible API bereit, sodass Sie sie lokal ausführen und LibreChat auf Ihren eigenen Server verweisen können.
Konfiguration
Lokale vLLM-Bereitstellungen erfordern keine Authentifizierung, daher ist der API-Schlüssel nur ein Platzhalter. Richten Sie baseURL auf Ihren laufenden vLLM-Server. Fügen Sie den endpoint unter endpoints.custom in Ihrer librechat.yaml hinzu:
Hinweise
- Das Beispiel stellt eine Verbindung zu einem lokalen vLLM-Server auf Port 8023 mit Gemma 3 27B als Standard her. Setzen Sie
baseURLauf den Ort, an dem Ihr Server läuft. - Mit
fetch: truelädt LibreChat die vollständige Liste der auf Ihrem vLLM-Server verfügbaren Modelle, sodassdefaultnur die anfängliche Auswahl darstellt. titleMessageRole: "user"überschreibt die standardmäßigesystem-Rolle für die Titelgenerierung. Einige lokale Modelle lehnen System-Nachrichtenrollen ab, daher vermeidet das Senden des Titel-Prompts als Benutzer-Nachricht Fehler.
Wie finden Sie diese Anleitung?