Gemini Afbeeldingsgeneratie
Installatie- en gebruiksinstructies voor Google Gemini-afbeeldingsgeneratie
Gemini Image Generation is een krachtige tool die Google's Gemini Image Models integreert voor tekst-naar-afbeelding generatie van hoge kwaliteit en beeldbewerking met contextbewustzijn. Het ondersteunt zowel de eenvoudige Gemini API als Google Cloud Vertex AI.
Installatie-instructies
Je kunt ofwel de Gemini API (aanbevolen voor de meeste gebruikers) of Vertex AI met een service account gebruiken.
Optie 1: Gemini API (Aanbevolen)
- Haal je API-sleutel op bij Google AI Studio
- Stel de
GEMINI_API_KEYomgevingsvariabele in in je.envbestand:
GEMINI_API_KEY=your_api_key_hereOptie 2: Vertex AI (Voor Enterprise/GCP-gebruikers)
- Maak een service account aan in de Google Cloud Console met Vertex AI-rechten
- Download het JSON-sleutelbestand van het serviceaccount
- Plaats het JSON-bestand in het project (bijv.
api/data/auth.json) of stel het pad in:
# Path to your service account JSON file (default: api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.json
# Optional: Set the location (default: global)
GOOGLE_CLOUD_LOCATION=us-central1Wanneer er geen GEMINI_API_KEY of GOOGLE_KEY is geconfigureerd, valt de tool automatisch terug op Vertex AI met behulp van het service account-bestand.
Na het configureren van de inloggegevens, herstart LibreChat en voeg Gemini Image Tools toe aan de Tools-lijst van een agent.
| Deployment | Command |
|---|---|
| Docker | docker compose down && docker compose up -d |
| Lokaal | Stop de server en voer daarna opnieuw npm run backend uit |
Configuratieopties
Modelselectie
Je kunt via een omgevingsvariabele kiezen welk Gemini-afbeeldingsmodel je wilt gebruiken:
# Default model
GEMINI_IMAGE_MODEL=gemini-2.5-flash-image
# Or use the newer Gemini 3 Pro Image model
GEMINI_IMAGE_MODEL=gemini-3-pro-image-previewBeschikbare modellen
| Model | Beschrijving |
|---|---|
gemini-2.5-flash-image | Standaardmodel, snel en efficiënt |
gemini-3-pro-image-preview | Hogere kwaliteit, meer gedetailleerde generaties |
Kenmerken
Kernmogelijkheden
- Text-to-Image Generation: Creëer afbeeldingen op basis van gedetailleerde tekstbeschrijvingen
- Ondersteuning voor afbeeldingscontext: Gebruik bestaande afbeeldingen als context/inspiratie voor nieuwe generaties
- Afbeeldingen bewerken: Genereer nieuwe afbeeldingen op basis van wijzigingen aan bestaande afbeeldingen
- Safety Filtering: Ingebouwde inhoudsbeveiliging met gebruiksvriendelijke foutmeldingen
Parameters
De Gemini Image Gen tool accepteert de volgende parameters:
- prompt (vereist) – Een gedetailleerde tekstbeschrijving van de gewenste afbeelding, tot 32.000 tekens
- image_ids (optioneel) – Array van image IDs om te gebruiken als visuele context voor generatie
Best Practices
Prompt schrijven
- Wees specifiek en gedetailleerd in je beschrijvingen
- Begin met het afbeeldingstype: photo, oil painting, watercolor, illustration, cartoon, drawing, vector, render, enz.
- Bevat de volgende kernonderdelen:
- Onderwerp en samenstelling
- Stijl en artistieke benadering
- Verlichting en sfeer
- Voorkeuren voor kleurenpalet
- Technische specificaties
Tips voor het bewerken van afbeeldingen
Bij het bewerken van bestaande afbeeldingen:
- Voeg het originele image ID toe aan de
image_idsarray - Gebruik directe bewerkingsinstructies:
- Verwijder de achtergrond van deze afbeelding
- Voeg een zonnebril toe aan de persoon op deze afbeelding
- Verander de kleur van de auto naar rood
- Reconstrueer de oorspronkelijke prompt niet – gebruik eenvoudige, directe wijzigingsinstructies
Gebruiksvoorbeelden
Basis Afbeeldingsgeneratie
Een serene Japanse tuin tijdens het gouden uur, met een traditionele rode brug over een koivijver. Kersenbloesembomen omlijsten het tafereel met zachtroze blaadjes die naar beneden vallen. Fotorealistische stijl met warme, diffuse verlichting en rijke kleuren.
Afbeelding met context
Wanneer je een bestaande afbeelding hebt en iets wilt creëren dat hierdoor is geïnspireerd:
- Verwijs naar het image ID in de
image_idsparameter - Beschrijf wat je wilt: "Maak een winterversie van dit landschap met besneeuwde bomen en een bevroren meer"
Afbeeldingen bewerken
Om een bestaande afbeelding te wijzigen:
- Voeg het image ID toe in
image_ids - Beschrijf de wijziging: "Verwijder de persoon van de achtergrond van deze afbeelding"
Foutafhandeling
Veelvoorkomende problemen
| Fout | Oplossing |
|---|---|
| "Image blocked by content safety filters" | Pas je prompt aan om inhoud te vermijden die in strijd is met het veiligheidsbeleid |
| "No image was generated" | Probeer een andere prompt of vereenvoudig je verzoek |
| "GEMINI_API_KEY or service account required" | Zorg ervoor dat je de API-sleutel of de Vertex AI-inloggegevens hebt geconfigureerd |
Veiligheidsfiltering
Gemini bevat ingebouwde veiligheidsfilters. Als je afbeelding wordt geblokkeerd:
- Controleer je prompt op potentieel problematische inhoud
- Probeer het te herformuleren om specifieker te zijn over de artistieke intentie
- Vermijd verzoeken om schadelijke, gewelddadige of expliciete inhoud
Technische details
Opslagintegratie
Gegenereerde afbeeldingen worden automatisch opgeslagen met behulp van uw geconfigureerde bestandsstrategie (local, S3, Azure of Firebase). Dit wordt afgehandeld door het framework — de tool retourneert afbeeldingsgegevens en het agent-callbacksysteem slaat deze op als een berichtbijlage.
Afbeeldingsformaat
- De standaardinstelling voor het uitvoerformaat is PNG, configureerbaar via de
imageOutputTypeinstelling van de app - Afbeeldingen bevatten unieke identificatiegegevens voor referentie in daaropvolgende verzoeken
Rate Limits
Rate limits zijn afhankelijk van je API-tier:
- Gemini API: Controleer Google AI Studio voor de huidige limieten
- Vertex AI: Gebaseerd op de quota van je Google Cloud-project
Hoe is deze gids?