Gemini 이미지 생성

Gemini Image Generation은 고품질 텍스트-투-이미지 생성 및 이미지 문맥 인식 편집을 위해 Google의 Gemini 이미지 모델을 통합하는 강력한 도구입니다. 이 기능은 간단한 Gemini API와 Google Cloud Vertex AI를 모두 지원합니다.

설정 지침

Gemini API(대부분의 사용자에게 권장) 또는 서비스 계정을 사용하는 Vertex AI 중 하나를 사용할 수 있습니다.

옵션 1: Gemini API (권장)

Google AI Studio에서 API 키를 받으세요.
.env 파일에 GEMINI_API_KEY 환경 변수를 설정하세요:

GEMINI_API_KEY=your_api_key_here

옵션 2: Vertex AI (기업/GCP 사용자용)

Google Cloud Console에서 Vertex AI 권한을 가진 서비스 계정을 생성하세요
서비스 계정 JSON 키 파일을 다운로드하세요
JSON 파일을 프로젝트(예: api/data/auth.json)에 배치하거나 경로를 설정하세요:

# Path to your service account JSON file (default: api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.json

# Optional: Set the location (default: global)
GOOGLE_CLOUD_LOCATION=us-central1

GEMINI_API_KEY 또는 GOOGLE_KEY가 구성되어 있지 않으면, 도구는 서비스 계정 파일을 사용하여 자동으로 Vertex AI로 대체(fallback)합니다.

자격 증명을 구성한 후, LibreChat을 재시작하고 에이전트의 Tools 목록에 Gemini Image Tools를 추가하세요.

배포	명령어
Docker	`docker compose down && docker compose up -d`
Local	서버를 중지한 후, `npm run backend`를 다시 실행하세요

구성 옵션

모델 선택

환경 변수를 통해 사용할 Gemini 이미지 모델을 선택할 수 있습니다:

# Default model
GEMINI_IMAGE_MODEL=gemini-2.5-flash-image

# Or use the newer Gemini 3 Pro Image model
GEMINI_IMAGE_MODEL=gemini-3-pro-image-preview

사용 가능한 모델

모델	설명
`gemini-2.5-flash-image`	기본 모델, 빠르고 효율적임
`gemini-3-pro-image-preview`	더 높은 품질, 더 상세한 생성

기능

핵심 기능

텍스트-투-이미지 생성: 상세한 텍스트 설명으로부터 이미지를 생성합니다.
이미지 컨텍스트 지원: 기존 이미지를 새로운 생성의 컨텍스트/영감으로 사용
이미지 편집: 기존 이미지를 수정한 내용을 바탕으로 새로운 이미지 생성
Safety Filtering: 사용자 친화적인 오류 메시지를 포함한 내장 콘텐츠 안전 기능

매개변수

Gemini Image Gen 도구는 다음 매개변수를 허용합니다:

prompt (필수) – 원하는 이미지에 대한 상세한 텍스트 설명 (최대 32,000자)
image_ids (선택 사항) – 생성 시 시각적 컨텍스트로 사용할 이미지 ID 배열

모범 사례

프롬프트 작성

구체적이고 상세하게 설명하세요
이미지 유형으로 시작하세요: photo, oil painting, watercolor, illustration, cartoon, drawing, vector, render 등.
주요 요소 포함:
- 주제 및 구성
- 스타일 및 예술적 접근 방식
- 조명 및 분위기
- 색상 팔레트 기본 설정
- 기술 사양

이미지 편집 팁

기존 이미지를 편집할 때:

image_ids 배열에 원본 이미지 ID를 포함하세요.
직접 편집 지침 사용:
- 이 이미지에서 배경을 제거하세요
- 이 이미지 속 인물에게 선글라스를 씌워주세요
- 자동차 색상을 빨간색으로 변경하세요
원래 프롬프트를 재구성하지 마세요 – 간단하고 직접적인 수정 지침을 사용하세요

사용 예시

기본 이미지 생성

골든 아워의 평온한 일본식 정원, 잉어 연못 위로 놓인 전통적인 붉은 다리가 특징입니다. 벚나무가 장면을 감싸고 있으며 부드러운 분홍색 꽃잎이 떨어지고 있습니다. 따뜻하고 은은한 조명과 풍부한 색감이 돋보이는 사실적인 스타일입니다.

컨텍스트가 포함된 이미지

기존 이미지가 있고 그 이미지에서 영감을 받은 무언가를 만들고 싶을 때:

image_ids 매개변수에서 이미지 ID를 참조하세요.
원하는 내용을 설명하세요: "눈 덮인 나무와 얼어붙은 호수가 있는 이 풍경의 겨울 버전을 만들어줘"

이미지 편집

기존 이미지를 수정하려면:

image_ids에 이미지 ID를 포함하세요.
변경 사항 설명: "이 이미지의 배경에서 사람을 제거해 줘"

오류 처리

일반적인 문제

오류	해결 방법
"Image blocked by content safety filters"	안전 정책을 위반하는 콘텐츠를 피하도록 프롬프트를 수정하세요
"No image was generated"	다른 프롬프트를 시도하거나 요청을 단순화하세요
"GEMINI_API_KEY or service account required"	API 키 또는 Vertex AI 자격 증명 중 하나가 구성되었는지 확인하세요

안전 필터링

Gemini에는 내장된 안전 필터가 포함되어 있습니다. 이미지가 차단된 경우:

잠재적으로 문제가 될 수 있는 콘텐츠가 있는지 프롬프트를 검토하세요
예술적 의도를 더 구체적으로 표현하도록 다시 작성해 보세요
유해하거나 폭력적이거나 노골적인 콘텐츠에 대한 요청을 피하세요

기술적 세부 사항

스토리지 통합

생성된 이미지는 구성된 파일 전략(local, S3, Azure 또는 Firebase)을 사용하여 자동으로 저장됩니다. 이는 프레임워크에 의해 처리되며, 도구가 이미지 데이터를 반환하면 에이전트 콜백 시스템이 이를 메시지 첨부 파일로 유지합니다.

이미지 형식

출력 형식은 기본적으로 PNG이며, 앱의 imageOutputType 설정을 통해 구성할 수 있습니다.
이미지에는 후속 요청에서 참조할 수 있도록 고유 식별자가 포함되어 있습니다.

속도 제한 (Rate Limits)

요금 제한은 사용 중인 API 티어에 따라 다릅니다:

Gemini API: 현재 제한 사항은 Google AI Studio에서 확인하세요.
Vertex AI: Google Cloud 프로젝트 할당량 기준