Pembuatan Gambar Gemini
Petunjuk pengaturan dan penggunaan untuk pembuatan gambar Google Gemini
Gemini Image Generation adalah alat canggih yang mengintegrasikan Model Gambar Gemini dari Google untuk pembuatan teks-ke-gambar berkualitas tinggi dan pengeditan gambar yang sadar konteks. Alat ini mendukung Gemini API sederhana maupun Google Cloud Vertex AI.
Petunjuk Pengaturan
Anda dapat menggunakan Gemini API (direkomendasikan untuk sebagian besar pengguna) atau Vertex AI dengan akun layanan.
Opsi 1: Gemini API (Direkomendasikan)
- Dapatkan kunci API Anda dari Google AI Studio
- Atur variabel lingkungan
GEMINI_API_KEYdi dalam file.envAnda:
GEMINI_API_KEY=your_api_key_hereOpsi 2: Vertex AI (Untuk Pengguna Enterprise/GCP)
- Buat akun layanan di Google Cloud Console dengan izin Vertex AI
- Unduh file kunci JSON akun layanan
- Tempatkan file JSON di dalam proyek (contoh:
api/data/auth.json) atau atur path-nya:
# Path to your service account JSON file (default: api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.json
# Optional: Set the location (default: global)
GOOGLE_CLOUD_LOCATION=us-central1Ketika tidak ada GEMINI_API_KEY atau GOOGLE_KEY yang dikonfigurasi, alat ini secara otomatis beralih ke Vertex AI menggunakan file akun layanan.
Setelah mengonfigurasi kredensial, mulai ulang LibreChat dan tambahkan Gemini Image Tools ke daftar Tools agen.
| Deployment | Command |
|---|---|
| Docker | docker compose down && docker compose up -d |
| Local | Hentikan server, lalu jalankan npm run backend kembali |
Opsi Konfigurasi
Pemilihan Model
Anda dapat memilih model gambar Gemini mana yang akan digunakan melalui variabel lingkungan:
# Default model
GEMINI_IMAGE_MODEL=gemini-2.5-flash-image
# Or use the newer Gemini 3 Pro Image model
GEMINI_IMAGE_MODEL=gemini-3-pro-image-previewModel yang Tersedia
| Model | Deskripsi |
|---|---|
gemini-2.5-flash-image | Model default, cepat dan efisien |
gemini-3-pro-image-preview | Kualitas lebih tinggi, generasi lebih mendetail |
Fitur
Kemampuan Inti
- Pembuatan Teks-ke-Gambar: Membuat gambar dari deskripsi teks yang mendetail
- Dukungan Konteks Gambar: Gunakan gambar yang sudah ada sebagai konteks/inspirasi untuk pembuatan gambar baru
- Penyuntingan Gambar: Menghasilkan gambar baru berdasarkan modifikasi pada gambar yang sudah ada
- Safety Filtering: Penyaringan konten bawaan dengan pesan kesalahan yang ramah pengguna
Parameter
Alat Gemini Image Gen menerima parameter berikut:
- prompt (wajib) – Deskripsi teks terperinci mengenai gambar yang diinginkan, hingga 32.000 karakter
- image_ids (opsional) – Array ID gambar untuk digunakan sebagai konteks visual bagi pembuatan konten
Praktik Terbaik
Penulisan Prompt
- Jadilah spesifik dan mendetail dalam deskripsi Anda
- Mulai dengan tipe gambar: photo, oil painting, watercolor, illustration, cartoon, drawing, vector, render, dll.
- Sertakan elemen kunci:
- Subjek dan komposisi
- Gaya dan pendekatan artistik
- Pencahayaan dan suasana
- Preferensi palet warna
- Spesifikasi teknis
Tips Pengeditan Gambar
Saat mengedit gambar yang sudah ada:
- Sertakan ID gambar asli di dalam array
image_ids - Gunakan instruksi penyuntingan langsung:
- Hapus latar belakang dari gambar ini
- Tambahkan kacamata hitam pada orang di gambar ini
- Ubah warna mobil menjadi merah
- Jangan menyusun ulang prompt asli – gunakan instruksi modifikasi yang sederhana dan langsung
Contoh Penggunaan
Pembuatan Gambar Dasar
Taman Jepang yang tenang saat golden hour, menampilkan jembatan merah tradisional di atas kolam koi. Pohon sakura membingkai pemandangan dengan kelopak merah muda yang lembut berguguran. Gaya fotorealistik dengan pencahayaan hangat yang lembut dan warna-warna yang kaya.
Gambar dengan Konteks
Saat Anda memiliki gambar yang sudah ada dan ingin membuat sesuatu yang terinspirasi darinya:
- Referensi ID gambar dalam parameter
image_ids - Jelaskan apa yang Anda inginkan: "Buat versi musim dingin dari pemandangan ini dengan pepohonan yang tertutup salju dan danau yang membeku"
Pengeditan Gambar
Untuk memodifikasi gambar yang sudah ada:
- Sertakan ID gambar di dalam
image_ids - Jelaskan perubahannya: "Hapus orang dari latar belakang gambar ini"
Penanganan Error
Masalah Umum
| Error | Solution |
|---|---|
| "Image blocked by content safety filters" | Ubah prompt Anda untuk menghindari konten yang melanggar kebijakan keamanan |
| "No image was generated" | Coba prompt yang berbeda atau sederhanakan permintaan Anda |
| "GEMINI_API_KEY or service account required" | Pastikan Anda telah mengonfigurasi kunci API atau kredensial Vertex AI |
Penyaringan Keamanan
Gemini menyertakan filter keamanan bawaan. Jika gambar Anda diblokir:
- Tinjau prompt Anda untuk konten yang berpotensi bermasalah
- Coba susun ulang kalimatnya agar lebih spesifik mengenai maksud artistik
- Hindari permintaan untuk konten yang berbahaya, penuh kekerasan, atau eksplisit
Detail Teknis
Integrasi Penyimpanan
Gambar yang dihasilkan disimpan secara otomatis menggunakan strategi file yang Anda konfigurasi (local, S3, Azure, atau Firebase). Hal ini ditangani oleh framework — tool mengembalikan data gambar dan sistem callback agen menyimpannya sebagai lampiran pesan.
Format Gambar
- Format output default adalah PNG, dapat dikonfigurasi melalui pengaturan
imageOutputTypedi aplikasi. - Gambar menyertakan pengenal unik untuk referensi dalam permintaan berikutnya
Batas Kecepatan (Rate Limits)
Batas kecepatan bergantung pada tingkat API Anda:
- Gemini API: Periksa Google AI Studio untuk batas saat ini
- Vertex AI: Berdasarkan kuota proyek Google Cloud Anda
Bagaimana panduan ini?