Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack 🎉 Learn more
LibreChat

Pembuatan Gambar Gemini

Petunjuk pengaturan dan penggunaan untuk pembuatan gambar Google Gemini

Gemini Image Generation adalah alat canggih yang mengintegrasikan Model Gambar Gemini dari Google untuk pembuatan teks-ke-gambar berkualitas tinggi dan pengeditan gambar yang sadar konteks. Alat ini mendukung Gemini API sederhana maupun Google Cloud Vertex AI.

Petunjuk Pengaturan

Anda dapat menggunakan Gemini API (direkomendasikan untuk sebagian besar pengguna) atau Vertex AI dengan akun layanan.

  1. Dapatkan kunci API Anda dari Google AI Studio
  2. Atur variabel lingkungan GEMINI_API_KEY di dalam file .env Anda:
GEMINI_API_KEY=your_api_key_here

Opsi 2: Vertex AI (Untuk Pengguna Enterprise/GCP)

  1. Buat akun layanan di Google Cloud Console dengan izin Vertex AI
  2. Unduh file kunci JSON akun layanan
  3. Tempatkan file JSON di dalam proyek (contoh: api/data/auth.json) atau atur path-nya:
# Path to your service account JSON file (default: api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.json

# Optional: Set the location (default: global)
GOOGLE_CLOUD_LOCATION=us-central1

Ketika tidak ada GEMINI_API_KEY atau GOOGLE_KEY yang dikonfigurasi, alat ini secara otomatis beralih ke Vertex AI menggunakan file akun layanan.

Setelah mengonfigurasi kredensial, mulai ulang LibreChat dan tambahkan Gemini Image Tools ke daftar Tools agen.

DeploymentCommand
Dockerdocker compose down && docker compose up -d
LocalHentikan server, lalu jalankan npm run backend kembali

Opsi Konfigurasi

Pemilihan Model

Anda dapat memilih model gambar Gemini mana yang akan digunakan melalui variabel lingkungan:

# Default model
GEMINI_IMAGE_MODEL=gemini-2.5-flash-image

# Or use the newer Gemini 3 Pro Image model
GEMINI_IMAGE_MODEL=gemini-3-pro-image-preview

Model yang Tersedia

ModelDeskripsi
gemini-2.5-flash-imageModel default, cepat dan efisien
gemini-3-pro-image-previewKualitas lebih tinggi, generasi lebih mendetail

Fitur

Kemampuan Inti

  • Pembuatan Teks-ke-Gambar: Membuat gambar dari deskripsi teks yang mendetail
  • Dukungan Konteks Gambar: Gunakan gambar yang sudah ada sebagai konteks/inspirasi untuk pembuatan gambar baru
  • Penyuntingan Gambar: Menghasilkan gambar baru berdasarkan modifikasi pada gambar yang sudah ada
  • Safety Filtering: Penyaringan konten bawaan dengan pesan kesalahan yang ramah pengguna

Parameter

Alat Gemini Image Gen menerima parameter berikut:

  • prompt (wajib) – Deskripsi teks terperinci mengenai gambar yang diinginkan, hingga 32.000 karakter
  • image_ids (opsional) – Array ID gambar untuk digunakan sebagai konteks visual bagi pembuatan konten

Praktik Terbaik

Penulisan Prompt

  1. Jadilah spesifik dan mendetail dalam deskripsi Anda
  2. Mulai dengan tipe gambar: photo, oil painting, watercolor, illustration, cartoon, drawing, vector, render, dll.
  3. Sertakan elemen kunci:
    • Subjek dan komposisi
    • Gaya dan pendekatan artistik
    • Pencahayaan dan suasana
    • Preferensi palet warna
    • Spesifikasi teknis

Tips Pengeditan Gambar

Saat mengedit gambar yang sudah ada:

  1. Sertakan ID gambar asli di dalam array image_ids
  2. Gunakan instruksi penyuntingan langsung:
    • Hapus latar belakang dari gambar ini
    • Tambahkan kacamata hitam pada orang di gambar ini
    • Ubah warna mobil menjadi merah
  3. Jangan menyusun ulang prompt asli – gunakan instruksi modifikasi yang sederhana dan langsung

Contoh Penggunaan

Pembuatan Gambar Dasar

Taman Jepang yang tenang saat golden hour, menampilkan jembatan merah tradisional di atas kolam koi. Pohon sakura membingkai pemandangan dengan kelopak merah muda yang lembut berguguran. Gaya fotorealistik dengan pencahayaan hangat yang lembut dan warna-warna yang kaya.

Gambar dengan Konteks

Saat Anda memiliki gambar yang sudah ada dan ingin membuat sesuatu yang terinspirasi darinya:

  1. Referensi ID gambar dalam parameter image_ids
  2. Jelaskan apa yang Anda inginkan: "Buat versi musim dingin dari pemandangan ini dengan pepohonan yang tertutup salju dan danau yang membeku"

Pengeditan Gambar

Untuk memodifikasi gambar yang sudah ada:

  1. Sertakan ID gambar di dalam image_ids
  2. Jelaskan perubahannya: "Hapus orang dari latar belakang gambar ini"

Penanganan Error

Masalah Umum

ErrorSolution
"Image blocked by content safety filters"Ubah prompt Anda untuk menghindari konten yang melanggar kebijakan keamanan
"No image was generated"Coba prompt yang berbeda atau sederhanakan permintaan Anda
"GEMINI_API_KEY or service account required"Pastikan Anda telah mengonfigurasi kunci API atau kredensial Vertex AI

Penyaringan Keamanan

Gemini menyertakan filter keamanan bawaan. Jika gambar Anda diblokir:

  • Tinjau prompt Anda untuk konten yang berpotensi bermasalah
  • Coba susun ulang kalimatnya agar lebih spesifik mengenai maksud artistik
  • Hindari permintaan untuk konten yang berbahaya, penuh kekerasan, atau eksplisit

Detail Teknis

Integrasi Penyimpanan

Gambar yang dihasilkan disimpan secara otomatis menggunakan strategi file yang Anda konfigurasi (local, S3, Azure, atau Firebase). Hal ini ditangani oleh framework — tool mengembalikan data gambar dan sistem callback agen menyimpannya sebagai lampiran pesan.

Format Gambar

  • Format output default adalah PNG, dapat dikonfigurasi melalui pengaturan imageOutputType di aplikasi.
  • Gambar menyertakan pengenal unik untuk referensi dalam permintaan berikutnya

Batas Kecepatan (Rate Limits)

Batas kecepatan bergantung pada tingkat API Anda:

  • Gemini API: Periksa Google AI Studio untuk batas saat ini
  • Vertex AI: Berdasarkan kuota proyek Google Cloud Anda

Bagaimana panduan ini?