Pembuatan Gambar Gemini

Gemini Image Generation adalah alat canggih yang mengintegrasikan Model Gambar Gemini dari Google untuk pembuatan teks-ke-gambar berkualitas tinggi dan pengeditan gambar yang sadar konteks. Alat ini mendukung Gemini API sederhana maupun Google Cloud Vertex AI.

Petunjuk Pengaturan

Anda dapat menggunakan Gemini API (direkomendasikan untuk sebagian besar pengguna) atau Vertex AI dengan akun layanan.

Opsi 1: Gemini API (Direkomendasikan)

Dapatkan kunci API Anda dari Google AI Studio
Atur variabel lingkungan GEMINI_API_KEY di dalam file .env Anda:

GEMINI_API_KEY=your_api_key_here

Opsi 2: Vertex AI (Untuk Pengguna Enterprise/GCP)

Buat akun layanan di Google Cloud Console dengan izin Vertex AI
Unduh file kunci JSON akun layanan
Tempatkan file JSON di dalam proyek (contoh: api/data/auth.json) atau atur path-nya:

# Path to your service account JSON file (default: api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.json

# Optional: Set the location (default: global)
GOOGLE_CLOUD_LOCATION=us-central1

Ketika tidak ada GEMINI_API_KEY atau GOOGLE_KEY yang dikonfigurasi, alat ini secara otomatis beralih ke Vertex AI menggunakan file akun layanan.

Setelah mengonfigurasi kredensial, mulai ulang LibreChat dan tambahkan Gemini Image Tools ke daftar Tools agen.

Deployment	Command
Docker	`docker compose down && docker compose up -d`
Local	Hentikan server, lalu jalankan `npm run backend` kembali

Opsi Konfigurasi

Pemilihan Model

Anda dapat memilih model gambar Gemini mana yang akan digunakan melalui variabel lingkungan:

# Default model
GEMINI_IMAGE_MODEL=gemini-2.5-flash-image

# Or use the newer Gemini 3 Pro Image model
GEMINI_IMAGE_MODEL=gemini-3-pro-image-preview

Model yang Tersedia

Model	Deskripsi
`gemini-2.5-flash-image`	Model default, cepat dan efisien
`gemini-3-pro-image-preview`	Kualitas lebih tinggi, generasi lebih mendetail

Fitur

Kemampuan Inti

Pembuatan Teks-ke-Gambar: Membuat gambar dari deskripsi teks yang mendetail
Dukungan Konteks Gambar: Gunakan gambar yang sudah ada sebagai konteks/inspirasi untuk pembuatan gambar baru
Penyuntingan Gambar: Menghasilkan gambar baru berdasarkan modifikasi pada gambar yang sudah ada
Safety Filtering: Penyaringan konten bawaan dengan pesan kesalahan yang ramah pengguna

Parameter

Alat Gemini Image Gen menerima parameter berikut:

prompt (wajib) – Deskripsi teks terperinci mengenai gambar yang diinginkan, hingga 32.000 karakter
image_ids (opsional) – Array ID gambar untuk digunakan sebagai konteks visual bagi pembuatan konten

Praktik Terbaik

Penulisan Prompt

Jadilah spesifik dan mendetail dalam deskripsi Anda
Mulai dengan tipe gambar: photo, oil painting, watercolor, illustration, cartoon, drawing, vector, render, dll.
Sertakan elemen kunci:
- Subjek dan komposisi
- Gaya dan pendekatan artistik
- Pencahayaan dan suasana
- Preferensi palet warna
- Spesifikasi teknis

Tips Pengeditan Gambar

Saat mengedit gambar yang sudah ada:

Sertakan ID gambar asli di dalam array image_ids
Gunakan instruksi penyuntingan langsung:
- Hapus latar belakang dari gambar ini
- Tambahkan kacamata hitam pada orang di gambar ini
- Ubah warna mobil menjadi merah
Jangan menyusun ulang prompt asli – gunakan instruksi modifikasi yang sederhana dan langsung

Contoh Penggunaan

Pembuatan Gambar Dasar

Taman Jepang yang tenang saat golden hour, menampilkan jembatan merah tradisional di atas kolam koi. Pohon sakura membingkai pemandangan dengan kelopak merah muda yang lembut berguguran. Gaya fotorealistik dengan pencahayaan hangat yang lembut dan warna-warna yang kaya.

Gambar dengan Konteks

Saat Anda memiliki gambar yang sudah ada dan ingin membuat sesuatu yang terinspirasi darinya:

Referensi ID gambar dalam parameter image_ids
Jelaskan apa yang Anda inginkan: "Buat versi musim dingin dari pemandangan ini dengan pepohonan yang tertutup salju dan danau yang membeku"

Pengeditan Gambar

Untuk memodifikasi gambar yang sudah ada:

Sertakan ID gambar di dalam image_ids
Jelaskan perubahannya: "Hapus orang dari latar belakang gambar ini"

Penanganan Error

Masalah Umum

Error	Solution
"Image blocked by content safety filters"	Ubah prompt Anda untuk menghindari konten yang melanggar kebijakan keamanan
"No image was generated"	Coba prompt yang berbeda atau sederhanakan permintaan Anda
"GEMINI_API_KEY or service account required"	Pastikan Anda telah mengonfigurasi kunci API atau kredensial Vertex AI

Penyaringan Keamanan

Gemini menyertakan filter keamanan bawaan. Jika gambar Anda diblokir:

Tinjau prompt Anda untuk konten yang berpotensi bermasalah
Coba susun ulang kalimatnya agar lebih spesifik mengenai maksud artistik
Hindari permintaan untuk konten yang berbahaya, penuh kekerasan, atau eksplisit

Detail Teknis

Integrasi Penyimpanan

Gambar yang dihasilkan disimpan secara otomatis menggunakan strategi file yang Anda konfigurasi (local, S3, Azure, atau Firebase). Hal ini ditangani oleh framework — tool mengembalikan data gambar dan sistem callback agen menyimpannya sebagai lampiran pesan.

Format Gambar

Format output default adalah PNG, dapat dikonfigurasi melalui pengaturan imageOutputType di aplikasi.
Gambar menyertakan pengenal unik untuk referensi dalam permintaan berikutnya

Batas Kecepatan (Rate Limits)

Batas kecepatan bergantung pada tingkat API Anda:

Gemini API: Periksa Google AI Studio untuk batas saat ini
Vertex AI: Berdasarkan kuota proyek Google Cloud Anda

Pembuatan Gambar Gemini

Di halaman ini