Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack 🎉 Learn more
LibreChat

Gemini Görsel Oluşturma

Google Gemini görsel oluşturma için kurulum ve kullanım talimatları

Gemini Image Generation, yüksek kaliteli metinden görüntüye oluşturma ve görüntü bağlamına duyarlı düzenleme için Google'ın Gemini Görüntü Modellerini entegre eden güçlü bir araçtır. Hem basit Gemini API'sini hem de Google Cloud Vertex AI'ı destekler.

Kurulum Talimatları

Gemini API'sini (çoğu kullanıcı için önerilir) veya bir hizmet hesabı ile Vertex AI'ı kullanabilirsiniz.

  1. API anahtarınızı Google AI Studio üzerinden alın
  2. .env dosyanızda GEMINI_API_KEY ortam değişkenini ayarlayın:
GEMINI_API_KEY=your_api_key_here

Seçenek 2: Vertex AI (Kurumsal/GCP Kullanıcıları İçin)

  1. Google Cloud Console üzerinde Vertex AI izinlerine sahip bir hizmet hesabı (service account) oluşturun
  2. Hizmet hesabı JSON anahtar dosyasını indirin
  3. JSON dosyasını projeye yerleştirin (örneğin, api/data/auth.json) veya yolu ayarlayın:
# Path to your service account JSON file (default: api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.json

# Optional: Set the location (default: global)
GOOGLE_CLOUD_LOCATION=us-central1

GEMINI_API_KEY veya GOOGLE_KEY yapılandırılmadığında, araç otomatik olarak hizmet hesabı dosyasını kullanarak Vertex AI'a geri döner.

Kimlik bilgilerini yapılandırdıktan sonra LibreChat'i yeniden başlatın ve bir temsilcinin Tools listesine Gemini Image Tools ekleyin.

DağıtımKomut
Dockerdocker compose down && docker compose up -d
YerelSunucuyu durdurun, ardından tekrar npm run backend komutunu çalıştırın

Yapılandırma Seçenekleri

Model Seçimi

Hangi Gemini görsel modelini kullanacağınızı ortam değişkeni aracılığıyla seçebilirsiniz:

# Default model
GEMINI_IMAGE_MODEL=gemini-2.5-flash-image

# Or use the newer Gemini 3 Pro Image model
GEMINI_IMAGE_MODEL=gemini-3-pro-image-preview

Kullanılabilir Modeller

ModelAçıklama
gemini-2.5-flash-imageVarsayılan model, hızlı ve verimli
gemini-3-pro-image-previewDaha yüksek kalite, daha detaylı üretimler

Özellikler

Temel Yetenekler

  • Metinden Görsele Oluşturma: Ayrıntılı metin açıklamalarından görseller oluşturun
  • Görsel Bağlam Desteği: Yeni nesiller için mevcut görselleri bağlam/ilham kaynağı olarak kullanın
  • Görsel Düzenleme: Mevcut görseller üzerinde yapılan değişikliklere dayalı olarak yeni görseller oluşturun
  • Güvenlik Filtreleme: Kullanıcı dostu hata mesajları ile yerleşik içerik güvenliği

Parametreler

Gemini Image Gen aracı aşağıdaki parametreleri kabul eder:

  • prompt (gerekli) – İstenen görselin 32.000 karaktere kadar ayrıntılı metin açıklaması
  • image_ids (isteğe bağlı) – Üretim için görsel bağlam olarak kullanılacak görsel kimliklerinden (ID) oluşan dizi

En İyi Uygulamalar

İstem Yazma

  1. Açıklamalarınızda belirli ve ayrıntılı olun
  2. Görsel türü ile başlayın: photo, oil painting, watercolor, illustration, cartoon, drawing, vector, render vb.
  3. Temel öğeleri dahil edin:
    • Konu ve kompozisyon
    • Stil ve sanatsal yaklaşım
    • Aydınlatma ve atmosfer
    • Renk paleti tercihleri
    • Teknik özellikler

Görsel Düzenleme İpuçları

Mevcut görselleri düzenlerken:

  1. image_ids dizisine orijinal görsel kimliğini (ID) dahil edin
  2. Doğrudan düzenleme talimatlarını kullanın:
    • Bu görselin arka planını kaldır
    • Bu görüntüdeki kişiye güneş gözlüğü ekle
    • Arabanın rengini kırmızıya değiştir
  3. Orijinal istemi yeniden oluşturmayın – basit, doğrudan değişiklik talimatları kullanın

Kullanım Örnekleri

Temel Görsel Oluşturma

Altın saatte, koi havuzu üzerinde geleneksel kırmızı bir köprünün bulunduğu huzurlu bir Japon bahçesi. Kiraz çiçeği ağaçları, dökülen yumuşak pembe yapraklarla sahneyi çerçeveliyor. Sıcak, yaygın ışıklandırma ve zengin renklerle fotogerçekçi tarz.

Bağlam İçeren Görsel

Mevcut bir görseliniz olduğunda ve ondan esinlenen bir şey oluşturmak istediğinizde:

  1. image_ids parametresinde görsel kimliğine (image ID) referans verin
  2. İstediğinizi tanımlayın: "Bu manzaranın karla kaplı ağaçlar ve donmuş bir göl içeren kış versiyonunu oluştur"

Görsel Düzenleme

Mevcut bir görseli değiştirmek için:

  1. image_ids içine resim kimliğini (ID) dahil edin
  2. Değişikliği tanımlayın: "Bu görselin arka planındaki kişiyi kaldır"

Hata Yönetimi

Yaygın Sorunlar

HataÇözüm
"Image blocked by content safety filters"Güvenlik politikalarını ihlal eden içeriklerden kaçınmak için isteminizi değiştirin
"No image was generated"Farklı bir istem deneyin veya isteğinizi basitleştirin
"GEMINI_API_KEY or service account required"API anahtarını veya Vertex AI kimlik bilgilerini yapılandırdığınızdan emin olun

Güvenlik Filtreleme

Gemini yerleşik güvenlik filtreleri içerir. Eğer görseliniz engellenirse:

  • İsteminizi potansiyel olarak sorunlu içerik açısından gözden geçirin
  • Sanatsal niyet konusunda daha spesifik olmayı deneyerek yeniden ifade edin
  • Zararlı, şiddet içeren veya müstehcen içerik taleplerinden kaçının

Teknik Detaylar

Depolama Entegrasyonu

Oluşturulan görseller, yapılandırdığınız dosya stratejisi (local, S3, Azure veya Firebase) kullanılarak otomatik olarak kaydedilir. Bu işlem çerçeve tarafından yönetilir; araç görüntü verisini döndürür ve aracı geri çağırma (agent callback) sistemi bunu bir mesaj eki olarak kalıcı hale getirir.

Resim Formatı

  • Çıktı biçimi varsayılan olarak PNG'dir, uygulamanın imageOutputType ayarı aracılığıyla yapılandırılabilir
  • Görseller, sonraki isteklerde referans alınmak üzere benzersiz tanımlayıcılar içerir

Hız Sınırları

Hız sınırları API katmanınıza bağlıdır:

  • Gemini API: Güncel limitler için Google AI Studio adresini kontrol edin
  • Vertex AI: Google Cloud proje kotalarınıza bağlıdır

Bu rehber nasıl?