Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack 🎉 Learn more
LibreChat

Gemini Afbeeldingsgeneratie

Installatie- en gebruiksinstructies voor Google Gemini-afbeeldingsgeneratie

Gemini Image Generation is een krachtige tool die Google's Gemini Image Models integreert voor tekst-naar-afbeelding generatie van hoge kwaliteit en beeldbewerking met contextbewustzijn. Het ondersteunt zowel de eenvoudige Gemini API als Google Cloud Vertex AI.

Installatie-instructies

Je kunt ofwel de Gemini API (aanbevolen voor de meeste gebruikers) of Vertex AI met een service account gebruiken.

  1. Haal je API-sleutel op bij Google AI Studio
  2. Stel de GEMINI_API_KEY omgevingsvariabele in in je .env bestand:
GEMINI_API_KEY=your_api_key_here

Optie 2: Vertex AI (Voor Enterprise/GCP-gebruikers)

  1. Maak een service account aan in de Google Cloud Console met Vertex AI-rechten
  2. Download het JSON-sleutelbestand van het serviceaccount
  3. Plaats het JSON-bestand in het project (bijv. api/data/auth.json) of stel het pad in:
# Path to your service account JSON file (default: api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.json

# Optional: Set the location (default: global)
GOOGLE_CLOUD_LOCATION=us-central1

Wanneer er geen GEMINI_API_KEY of GOOGLE_KEY is geconfigureerd, valt de tool automatisch terug op Vertex AI met behulp van het service account-bestand.

Na het configureren van de inloggegevens, herstart LibreChat en voeg Gemini Image Tools toe aan de Tools-lijst van een agent.

DeploymentCommand
Dockerdocker compose down && docker compose up -d
LokaalStop de server en voer daarna opnieuw npm run backend uit

Configuratieopties

Modelselectie

Je kunt via een omgevingsvariabele kiezen welk Gemini-afbeeldingsmodel je wilt gebruiken:

# Default model
GEMINI_IMAGE_MODEL=gemini-2.5-flash-image

# Or use the newer Gemini 3 Pro Image model
GEMINI_IMAGE_MODEL=gemini-3-pro-image-preview

Beschikbare modellen

ModelBeschrijving
gemini-2.5-flash-imageStandaardmodel, snel en efficiënt
gemini-3-pro-image-previewHogere kwaliteit, meer gedetailleerde generaties

Kenmerken

Kernmogelijkheden

  • Text-to-Image Generation: Creëer afbeeldingen op basis van gedetailleerde tekstbeschrijvingen
  • Ondersteuning voor afbeeldingscontext: Gebruik bestaande afbeeldingen als context/inspiratie voor nieuwe generaties
  • Afbeeldingen bewerken: Genereer nieuwe afbeeldingen op basis van wijzigingen aan bestaande afbeeldingen
  • Safety Filtering: Ingebouwde inhoudsbeveiliging met gebruiksvriendelijke foutmeldingen

Parameters

De Gemini Image Gen tool accepteert de volgende parameters:

  • prompt (vereist) – Een gedetailleerde tekstbeschrijving van de gewenste afbeelding, tot 32.000 tekens
  • image_ids (optioneel) – Array van image IDs om te gebruiken als visuele context voor generatie

Best Practices

Prompt schrijven

  1. Wees specifiek en gedetailleerd in je beschrijvingen
  2. Begin met het afbeeldingstype: photo, oil painting, watercolor, illustration, cartoon, drawing, vector, render, enz.
  3. Bevat de volgende kernonderdelen:
    • Onderwerp en samenstelling
    • Stijl en artistieke benadering
    • Verlichting en sfeer
    • Voorkeuren voor kleurenpalet
    • Technische specificaties

Tips voor het bewerken van afbeeldingen

Bij het bewerken van bestaande afbeeldingen:

  1. Voeg het originele image ID toe aan de image_ids array
  2. Gebruik directe bewerkingsinstructies:
    • Verwijder de achtergrond van deze afbeelding
    • Voeg een zonnebril toe aan de persoon op deze afbeelding
    • Verander de kleur van de auto naar rood
  3. Reconstrueer de oorspronkelijke prompt niet – gebruik eenvoudige, directe wijzigingsinstructies

Gebruiksvoorbeelden

Basis Afbeeldingsgeneratie

Een serene Japanse tuin tijdens het gouden uur, met een traditionele rode brug over een koivijver. Kersenbloesembomen omlijsten het tafereel met zachtroze blaadjes die naar beneden vallen. Fotorealistische stijl met warme, diffuse verlichting en rijke kleuren.

Afbeelding met context

Wanneer je een bestaande afbeelding hebt en iets wilt creëren dat hierdoor is geïnspireerd:

  1. Verwijs naar het image ID in de image_ids parameter
  2. Beschrijf wat je wilt: "Maak een winterversie van dit landschap met besneeuwde bomen en een bevroren meer"

Afbeeldingen bewerken

Om een bestaande afbeelding te wijzigen:

  1. Voeg het image ID toe in image_ids
  2. Beschrijf de wijziging: "Verwijder de persoon van de achtergrond van deze afbeelding"

Foutafhandeling

Veelvoorkomende problemen

FoutOplossing
"Image blocked by content safety filters"Pas je prompt aan om inhoud te vermijden die in strijd is met het veiligheidsbeleid
"No image was generated"Probeer een andere prompt of vereenvoudig je verzoek
"GEMINI_API_KEY or service account required"Zorg ervoor dat je de API-sleutel of de Vertex AI-inloggegevens hebt geconfigureerd

Veiligheidsfiltering

Gemini bevat ingebouwde veiligheidsfilters. Als je afbeelding wordt geblokkeerd:

  • Controleer je prompt op potentieel problematische inhoud
  • Probeer het te herformuleren om specifieker te zijn over de artistieke intentie
  • Vermijd verzoeken om schadelijke, gewelddadige of expliciete inhoud

Technische details

Opslagintegratie

Gegenereerde afbeeldingen worden automatisch opgeslagen met behulp van uw geconfigureerde bestandsstrategie (local, S3, Azure of Firebase). Dit wordt afgehandeld door het framework — de tool retourneert afbeeldingsgegevens en het agent-callbacksysteem slaat deze op als een berichtbijlage.

Afbeeldingsformaat

  • De standaardinstelling voor het uitvoerformaat is PNG, configureerbaar via de imageOutputType instelling van de app
  • Afbeeldingen bevatten unieke identificatiegegevens voor referentie in daaropvolgende verzoeken

Rate Limits

Rate limits zijn afhankelijk van je API-tier:

  • Gemini API: Controleer Google AI Studio voor de huidige limieten
  • Vertex AI: Gebaseerd op de quota van je Google Cloud-project

Hoe is deze gids?