Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack 🎉 Learn more
LibreChat

Gemini 画像生成

Google Gemini画像生成のセットアップと使用手順

Gemini Image Generationは、GoogleのGemini Imageモデルを統合し、高品質なテキストから画像への生成や、画像コンテキストを認識した編集を行うための強力なツールです。シンプルなGemini APIとGoogle Cloud Vertex AIの両方をサポートしています。

セットアップ手順

Gemini API(ほとんどのユーザーに推奨)またはサービスアカウントを使用したVertex AIのいずれかを使用できます。

  1. Google AI Studio からAPIキーを取得してください。
  2. .env ファイルに GEMINI_API_KEY 環境変数を設定します:
GEMINI_API_KEY=your_api_key_here

オプション 2: Vertex AI (エンタープライズ/GCP ユーザー向け)

  1. Google Cloud ConsoleでVertex AI権限を持つサービスアカウントを作成します
  2. サービスアカウントのJSONキーファイルをダウンロードします
  3. JSONファイルをプロジェクト内(例: api/data/auth.json)に配置するか、パスを設定してください:
# Path to your service account JSON file (default: api/data/auth.json)
GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.json
 
# Optional: Set the location (default: global)
GOOGLE_CLOUD_LOCATION=us-central1

GEMINI_API_KEY または GOOGLE_KEY が設定されていない場合、ツールは自動的にサービスアカウントファイルを使用して Vertex AI にフォールバックします。

認証情報を設定した後、LibreChatを再起動し、エージェントのToolsリストにGemini Image Toolsを追加してください。

デプロイコマンド
Dockerdocker compose down && docker compose up -d
ローカルサーバーを停止し、再度 npm run backend を実行します

設定オプション

モデルの選択

環境変数を使用して、使用するGemini画像モデルを選択できます:

# Default model
GEMINI_IMAGE_MODEL=gemini-2.5-flash-image
 
# Or use the newer Gemini 3 Pro Image model
GEMINI_IMAGE_MODEL=gemini-3-pro-image-preview

利用可能なモデル

モデル説明
gemini-2.5-flash-imageデフォルトモデル、高速かつ効率的
gemini-3-pro-image-previewより高品質で詳細な生成

機能

主要機能

  • Text-to-Image Generation: 詳細なテキスト説明から画像を生成します
  • 画像コンテキストのサポート: 既存の画像を新しい生成のコンテキストやインスピレーションとして使用します
  • 画像編集: 既存の画像への変更に基づいて新しい画像を生成します
  • Safety Filtering: ユーザーフレンドリーなエラーメッセージを備えた組み込みのコンテンツ安全性機能

パラメータ

Gemini Image Gen ツールは、以下のパラメータを受け付けます:

  • prompt (必須) – 目的の画像の詳細なテキスト説明(最大32,000文字)
  • image_ids (optional) – 生成の視覚的コンテキストとして使用する画像IDの配列

ベストプラクティス

プロンプトの作成

  1. 具体的かつ詳細に記述してください
  2. 画像タイプから始める: photo, oil painting, watercolor, illustration, cartoon, drawing, vector, render など。
  3. 主要な要素を含める:
    • 主題と構成
    • スタイルと芸術的アプローチ
    • 照明と雰囲気
    • カラーパレットの設定
    • 技術仕様

画像編集のヒント

既存の画像を編集する場合:

  1. image_ids 配列に 元の画像IDを含めてください
  2. 直接編集の指示を使用する:
    • この画像の背景を削除して
    • この画像の人物にサングラスを追加してください
    • 車の色を赤に変更する
  3. 元のプロンプトを再構築しないでください – シンプルで直接的な修正指示を使用してください

使用例

基本的な画像生成

ゴールデンアワーの穏やかな日本庭園。鯉が泳ぐ池に架かる伝統的な赤い橋が特徴です。桜の木々がその光景を縁取り、柔らかなピンクの花びらが舞い散っています。温かく柔らかな光と豊かな色彩を用いた、フォトリアルなスタイル。

コンテキスト付き画像

既存の画像があり、それを基にした何かを作成したい場合:

  1. image_ids パラメータで画像 ID を参照してください。
  2. 希望する内容を記述してください: "この風景シーンの冬バージョンを作成してください。雪に覆われた木々と凍った湖を含めてください"

画像編集

既存の画像を編集するには:

  1. image_ids に画像IDを含めてください
  2. 変更内容を記述してください: "Remove the person from the background of this image"

エラーハンドリング

よくある問題

エラー解決策
"Image blocked by content safety filters"安全ポリシーに違反するコンテンツを避けるようにプロンプトを修正してください
"No image was generated"別のプロンプトを試すか、リクエストを簡略化してください
"GEMINI_API_KEY or service account required"APIキーまたはVertex AIの認証情報が設定されていることを確認してください

セーフティフィルタリング

Geminiには組み込みの安全フィルターが含まれています。画像がブロックされた場合は、以下を確認してください:

  • プロンプトに問題のあるコンテンツが含まれていないか確認してください
  • 芸術的な意図についてより具体的に記述するように言い換えてみてください
  • 有害、暴力的、または露骨なコンテンツの要求を避けてください

技術的な詳細

ストレージ統合

生成された画像は、設定したファイル戦略(local、S3、Azure、またはFirebase)を使用して自動的に保存されます。これはフレームワークによって処理されます。ツールが画像データを返し、エージェントのコールバックシステムがそれをメッセージの添付ファイルとして永続化します。

画像フォーマット

  • 出力形式はデフォルトでPNGですが、アプリの imageOutputType 設定で変更可能です。
  • 画像には、後続のリクエストで参照するための固有の識別子が含まれています。

レート制限

レート制限は、ご利用のAPIティアによって異なります:

  • Gemini API: 現在の制限については Google AI Studio を確認してください
  • Vertex AI: Google Cloud プロジェクトのクォータに基づきます

このガイドはいかがでしたか?