Gemini Görsel Oluşturma
Google Gemini görsel oluşturma için kurulum ve kullanım talimatları
Gemini Image Generation, yüksek kaliteli metinden görüntüye oluşturma ve görüntü bağlamına duyarlı düzenleme için Google'ın Gemini Görüntü Modellerini entegre eden güçlü bir araçtır. Hem basit Gemini API'sini hem de Google Cloud Vertex AI'ı destekler.
Kurulum Talimatları
Gemini API'sini (çoğu kullanıcı için önerilir) veya bir hizmet hesabı ile Vertex AI'ı kullanabilirsiniz.
Seçenek 1: Gemini API (Önerilen)
- API anahtarınızı Google AI Studio üzerinden alın
.envdosyanızdaGEMINI_API_KEYortam değişkenini ayarlayın:
GEMINI_API_KEY=your_api_key_hereSeçenek 2: Vertex AI (Kurumsal/GCP Kullanıcıları İçin)
- Google Cloud Console üzerinde Vertex AI izinlerine sahip bir hizmet hesabı (service account) oluşturun
- Hizmet hesabı JSON anahtar dosyasını indirin
- JSON dosyasını projeye yerleştirin (örneğin,
api/data/auth.json) veya yolu ayarlayın:
# Path to your service account JSON file (default: api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.json
# Optional: Set the location (default: global)
GOOGLE_CLOUD_LOCATION=us-central1GEMINI_API_KEY veya GOOGLE_KEY yapılandırılmadığında, araç otomatik olarak hizmet hesabı dosyasını kullanarak Vertex AI'a geri döner.
Kimlik bilgilerini yapılandırdıktan sonra LibreChat'i yeniden başlatın ve bir temsilcinin Tools listesine Gemini Image Tools ekleyin.
| Dağıtım | Komut |
|---|---|
| Docker | docker compose down && docker compose up -d |
| Yerel | Sunucuyu durdurun, ardından tekrar npm run backend komutunu çalıştırın |
Yapılandırma Seçenekleri
Model Seçimi
Hangi Gemini görsel modelini kullanacağınızı ortam değişkeni aracılığıyla seçebilirsiniz:
# Default model
GEMINI_IMAGE_MODEL=gemini-2.5-flash-image
# Or use the newer Gemini 3 Pro Image model
GEMINI_IMAGE_MODEL=gemini-3-pro-image-previewKullanılabilir Modeller
| Model | Açıklama |
|---|---|
gemini-2.5-flash-image | Varsayılan model, hızlı ve verimli |
gemini-3-pro-image-preview | Daha yüksek kalite, daha detaylı üretimler |
Özellikler
Temel Yetenekler
- Metinden Görsele Oluşturma: Ayrıntılı metin açıklamalarından görseller oluşturun
- Görsel Bağlam Desteği: Yeni nesiller için mevcut görselleri bağlam/ilham kaynağı olarak kullanın
- Görsel Düzenleme: Mevcut görseller üzerinde yapılan değişikliklere dayalı olarak yeni görseller oluşturun
- Güvenlik Filtreleme: Kullanıcı dostu hata mesajları ile yerleşik içerik güvenliği
Parametreler
Gemini Image Gen aracı aşağıdaki parametreleri kabul eder:
- prompt (gerekli) – İstenen görselin 32.000 karaktere kadar ayrıntılı metin açıklaması
- image_ids (isteğe bağlı) – Üretim için görsel bağlam olarak kullanılacak görsel kimliklerinden (ID) oluşan dizi
En İyi Uygulamalar
İstem Yazma
- Açıklamalarınızda belirli ve ayrıntılı olun
- Görsel türü ile başlayın: photo, oil painting, watercolor, illustration, cartoon, drawing, vector, render vb.
- Temel öğeleri dahil edin:
- Konu ve kompozisyon
- Stil ve sanatsal yaklaşım
- Aydınlatma ve atmosfer
- Renk paleti tercihleri
- Teknik özellikler
Görsel Düzenleme İpuçları
Mevcut görselleri düzenlerken:
image_idsdizisine orijinal görsel kimliğini (ID) dahil edin- Doğrudan düzenleme talimatlarını kullanın:
- Bu görselin arka planını kaldır
- Bu görüntüdeki kişiye güneş gözlüğü ekle
- Arabanın rengini kırmızıya değiştir
- Orijinal istemi yeniden oluşturmayın – basit, doğrudan değişiklik talimatları kullanın
Kullanım Örnekleri
Temel Görsel Oluşturma
Altın saatte, koi havuzu üzerinde geleneksel kırmızı bir köprünün bulunduğu huzurlu bir Japon bahçesi. Kiraz çiçeği ağaçları, dökülen yumuşak pembe yapraklarla sahneyi çerçeveliyor. Sıcak, yaygın ışıklandırma ve zengin renklerle fotogerçekçi tarz.
Bağlam İçeren Görsel
Mevcut bir görseliniz olduğunda ve ondan esinlenen bir şey oluşturmak istediğinizde:
image_idsparametresinde görsel kimliğine (image ID) referans verin- İstediğinizi tanımlayın: "Bu manzaranın karla kaplı ağaçlar ve donmuş bir göl içeren kış versiyonunu oluştur"
Görsel Düzenleme
Mevcut bir görseli değiştirmek için:
image_idsiçine resim kimliğini (ID) dahil edin- Değişikliği tanımlayın: "Bu görselin arka planındaki kişiyi kaldır"
Hata Yönetimi
Yaygın Sorunlar
| Hata | Çözüm |
|---|---|
| "Image blocked by content safety filters" | Güvenlik politikalarını ihlal eden içeriklerden kaçınmak için isteminizi değiştirin |
| "No image was generated" | Farklı bir istem deneyin veya isteğinizi basitleştirin |
| "GEMINI_API_KEY or service account required" | API anahtarını veya Vertex AI kimlik bilgilerini yapılandırdığınızdan emin olun |
Güvenlik Filtreleme
Gemini yerleşik güvenlik filtreleri içerir. Eğer görseliniz engellenirse:
- İsteminizi potansiyel olarak sorunlu içerik açısından gözden geçirin
- Sanatsal niyet konusunda daha spesifik olmayı deneyerek yeniden ifade edin
- Zararlı, şiddet içeren veya müstehcen içerik taleplerinden kaçının
Teknik Detaylar
Depolama Entegrasyonu
Oluşturulan görseller, yapılandırdığınız dosya stratejisi (local, S3, Azure veya Firebase) kullanılarak otomatik olarak kaydedilir. Bu işlem çerçeve tarafından yönetilir; araç görüntü verisini döndürür ve aracı geri çağırma (agent callback) sistemi bunu bir mesaj eki olarak kalıcı hale getirir.
Resim Formatı
- Çıktı biçimi varsayılan olarak PNG'dir, uygulamanın
imageOutputTypeayarı aracılığıyla yapılandırılabilir - Görseller, sonraki isteklerde referans alınmak üzere benzersiz tanımlayıcılar içerir
Hız Sınırları
Hız sınırları API katmanınıza bağlıdır:
- Gemini API: Güncel limitler için Google AI Studio adresini kontrol edin
- Vertex AI: Google Cloud proje kotalarınıza bağlıdır
Bu rehber nasıl?