Gemini Afbeeldingsgeneratie

Gemini Image Generation is een krachtige tool die Google's Gemini Image Models integreert voor tekst-naar-afbeelding generatie van hoge kwaliteit en beeldbewerking met contextbewustzijn. Het ondersteunt zowel de eenvoudige Gemini API als Google Cloud Vertex AI.

Installatie-instructies

Je kunt ofwel de Gemini API (aanbevolen voor de meeste gebruikers) of Vertex AI met een service account gebruiken.

Optie 1: Gemini API (Aanbevolen)

Haal je API-sleutel op bij Google AI Studio
Stel de GEMINI_API_KEY omgevingsvariabele in in je .env bestand:

GEMINI_API_KEY=your_api_key_here

Optie 2: Vertex AI (Voor Enterprise/GCP-gebruikers)

Maak een service account aan in de Google Cloud Console met Vertex AI-rechten
Download het JSON-sleutelbestand van het serviceaccount
Plaats het JSON-bestand in het project (bijv. api/data/auth.json) of stel het pad in:

# Path to your service account JSON file (default: api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.json

# Optional: Set the location (default: global)
GOOGLE_CLOUD_LOCATION=us-central1

Wanneer er geen GEMINI_API_KEY of GOOGLE_KEY is geconfigureerd, valt de tool automatisch terug op Vertex AI met behulp van het service account-bestand.

Na het configureren van de inloggegevens, herstart LibreChat en voeg Gemini Image Tools toe aan de Tools-lijst van een agent.

Deployment	Command
Docker	`docker compose down && docker compose up -d`
Lokaal	Stop de server en voer daarna opnieuw `npm run backend` uit

Configuratieopties

Modelselectie

Je kunt via een omgevingsvariabele kiezen welk Gemini-afbeeldingsmodel je wilt gebruiken:

# Default model
GEMINI_IMAGE_MODEL=gemini-2.5-flash-image

# Or use the newer Gemini 3 Pro Image model
GEMINI_IMAGE_MODEL=gemini-3-pro-image-preview

Beschikbare modellen

Model	Beschrijving
`gemini-2.5-flash-image`	Standaardmodel, snel en efficiënt
`gemini-3-pro-image-preview`	Hogere kwaliteit, meer gedetailleerde generaties

Kenmerken

Kernmogelijkheden

Text-to-Image Generation: Creëer afbeeldingen op basis van gedetailleerde tekstbeschrijvingen
Ondersteuning voor afbeeldingscontext: Gebruik bestaande afbeeldingen als context/inspiratie voor nieuwe generaties
Afbeeldingen bewerken: Genereer nieuwe afbeeldingen op basis van wijzigingen aan bestaande afbeeldingen
Safety Filtering: Ingebouwde inhoudsbeveiliging met gebruiksvriendelijke foutmeldingen

Parameters

De Gemini Image Gen tool accepteert de volgende parameters:

prompt (vereist) – Een gedetailleerde tekstbeschrijving van de gewenste afbeelding, tot 32.000 tekens
image_ids (optioneel) – Array van image IDs om te gebruiken als visuele context voor generatie

Best Practices

Prompt schrijven

Wees specifiek en gedetailleerd in je beschrijvingen
Begin met het afbeeldingstype: photo, oil painting, watercolor, illustration, cartoon, drawing, vector, render, enz.
Bevat de volgende kernonderdelen:
- Onderwerp en samenstelling
- Stijl en artistieke benadering
- Verlichting en sfeer
- Voorkeuren voor kleurenpalet
- Technische specificaties

Tips voor het bewerken van afbeeldingen

Bij het bewerken van bestaande afbeeldingen:

Voeg het originele image ID toe aan de image_ids array
Gebruik directe bewerkingsinstructies:
- Verwijder de achtergrond van deze afbeelding
- Voeg een zonnebril toe aan de persoon op deze afbeelding
- Verander de kleur van de auto naar rood
Reconstrueer de oorspronkelijke prompt niet – gebruik eenvoudige, directe wijzigingsinstructies

Gebruiksvoorbeelden

Basis Afbeeldingsgeneratie

Een serene Japanse tuin tijdens het gouden uur, met een traditionele rode brug over een koivijver. Kersenbloesembomen omlijsten het tafereel met zachtroze blaadjes die naar beneden vallen. Fotorealistische stijl met warme, diffuse verlichting en rijke kleuren.

Afbeelding met context

Wanneer je een bestaande afbeelding hebt en iets wilt creëren dat hierdoor is geïnspireerd:

Verwijs naar het image ID in de image_ids parameter
Beschrijf wat je wilt: "Maak een winterversie van dit landschap met besneeuwde bomen en een bevroren meer"

Afbeeldingen bewerken

Om een bestaande afbeelding te wijzigen:

Voeg het image ID toe in image_ids
Beschrijf de wijziging: "Verwijder de persoon van de achtergrond van deze afbeelding"

Foutafhandeling

Veelvoorkomende problemen

Fout	Oplossing
"Image blocked by content safety filters"	Pas je prompt aan om inhoud te vermijden die in strijd is met het veiligheidsbeleid
"No image was generated"	Probeer een andere prompt of vereenvoudig je verzoek
"GEMINI_API_KEY or service account required"	Zorg ervoor dat je de API-sleutel of de Vertex AI-inloggegevens hebt geconfigureerd

Veiligheidsfiltering

Gemini bevat ingebouwde veiligheidsfilters. Als je afbeelding wordt geblokkeerd:

Controleer je prompt op potentieel problematische inhoud
Probeer het te herformuleren om specifieker te zijn over de artistieke intentie
Vermijd verzoeken om schadelijke, gewelddadige of expliciete inhoud

Technische details

Opslagintegratie

Gegenereerde afbeeldingen worden automatisch opgeslagen met behulp van uw geconfigureerde bestandsstrategie (local, S3, Azure of Firebase). Dit wordt afgehandeld door het framework — de tool retourneert afbeeldingsgegevens en het agent-callbacksysteem slaat deze op als een berichtbijlage.

Afbeeldingsformaat

De standaardinstelling voor het uitvoerformaat is PNG, configureerbaar via de imageOutputType instelling van de app
Afbeeldingen bevatten unieke identificatiegegevens voor referentie in daaropvolgende verzoeken

Rate Limits

Rate limits zijn afhankelijk van je API-tier:

Gemini API: Controleer Google AI Studio voor de huidige limieten
Vertex AI: Gebaseerd op de quota van je Google Cloud-project

Gemini Afbeeldingsgeneratie

Op deze pagina