Görsel Oluşturma ve Düzenleme

LibreChat'in yerleşik görsel oluşturma ve düzenleme araçları için kapsamlı rehber

LibreChat, bir Agent öğesine ekleyebileceğiniz yerleşik görsel araçlarıyla birlikte gelir. Her aracın kendine ait bir modeli, fiyat noktası ve kurulumu vardır; genellikle sadece bir API anahtarı veya URL gerektirir. Ayrı bir görsel sayfası yoktur: görselleri, görsel aracı etkinleştirilmiş bir Agent ile sohbet ederek oluşturur veya düzenlersiniz.

Görsel oluşturma nasıl çalışır

Düzenleme istediğinizde bir görsel yükleyin veya yeni bir görsel istediğinizde düz metin bir istem gönderin. Oluşturulan görseller yapılandırılmış fileStrategy ayarını takip eder ve araç çıktısı, oluşturma işleminden hemen sonra sohbet bağlamının bir parçası olarak LLM'e gönderilir.

Hızlı Başlangıç

OpenAI Image Tools ile birkaç dakika içinde görsel oluşturmayı çalışır hale getirin.

Bir ajan oluşturun. Uç nokta menüsünden Agents seçeneğini belirleyin, yan panelden Agent Builder'ı açın ve yeni bir ajan oluşturun. Ona "Image Creator" gibi bir isim verin.

OpenAI Image Tools ekleyin. Ajanın Tools listesini açın, OpenAI Image Tools seçeneğini belirleyin ve ajanı kaydedin. Bu, hem görsel oluşturma hem de görsel düzenleme yeteneklerini ekler.

API anahtarınızı ayarlayın. .env dosyanıza aşağıdakileri ekleyin:

IMAGE_GEN_OAI_API_KEY=sk-your-openai-api-key
# Optional; defaults to gpt-image-1
IMAGE_GEN_OAI_MODEL=gpt-image-1

Yeniden başlatın ve test edin. LibreChat'i yeniden başlatın, ardından ajanıza "Dağların üzerinde gün batımını gösteren bir resim oluştur" gibi bir mesaj gönderin.

Dağıtım	Komut
Docker	`docker compose down && docker compose up -d`
Yerel	Durdur (Ctrl+C) ve ardından `npm run backend`

Bilmekte fayda var

API anahtarları, kullanıcıların kendi anahtarlarını arayüz üzerinden girmelerine izin vermek için atlanabilir.
Görüntü çıktıları, her mesajda değil, yalnızca oluşturulduktan hemen sonra LLM'e gönderilir. LLM, bunun dışında görüntü bağlamını yalnızca kullanıcı mesajlarına eklenen görüntülerden alır. Bkz. Image Storage and Handling.
MCP sunucu araçları da görsel çıktısı verebilir, ancak her zaman doğru formatı kullanmayabilirler. MCP bölümüne bakın.

OpenAI Görüntü Araçları

"OpenAI Image Tools", iki ayrı araçtan oluşan bir aracı araç setidir:

Görsel Oluşturma (Image Generation), metin istemlerinden yepyeni görseller oluşturur (yükleme gerektirmez).
Görüntü Düzenleme (Image Editing), yüklediğiniz görüntüleri düzenler veya yeniden oluşturur: renkleri değiştirin, nesneler ekleyin, tuvali genişletin ve daha fazlasını yapın.

Her ikisi de talimat takibi, metin oluşturma, ayrıntılı düzenleme ve gerçek dünya bilgisi için varsayılan olarak GPT-Image-1 modelini kullanır. Dağıtımınız desteklediğinde farklı bir OpenAI görsel modeli seçmek için IMAGE_GEN_OAI_MODEL kullanın. Daha fazla ayrıntı için OpenAI'ın Image Generation documentation sayfasına bakın.

Oluşturma ve Düzenleme (Generation vs. Editing)

Kullanım durumu	Çağırır
"Sıfırdan başla"	Görsel Oluşturma
"Mevcut görsel(leri) kullan"	Görsel Düzenleme

Her iki araç da her zaman kullanılabilir durumdadır ve ajan, isteğe bağlı olarak uygun olanı seçer:

Görsel Oluşturma (Image Generation), yalnızca metin açıklamalarından yeni görseller oluşturur.
Görüntü Düzenleme (Image Editing), mevcut görüntüleri, görüntü kimliklerini (image IDs) kullanarak değiştirir veya yeniden düzenler. Bunlar, mevcut mesajdaki veya daha önce oluşturulmuş ve referans verilmiş görüntüler olabilir. LLM, görüntü kimliklerini bağlam penceresinde kaldıkları sürece takip eder ve bunları araç çıktısına dahil eder.

Görüntü düzenleme, görüntü kimliklerine (image IDs) dayanır

Görsel kimlikleri (Image IDs) sohbet geçmişinde tutulur. Dosyalar mevcut isteğe yüklendiğinde, kimlikleri herhangi bir token oluşturulmadan önce LLM'in bağlamına eklenir.
Daha önce referans verilen veya oluşturulan görsel kimlikleri (ID'leri), bağlam penceresi içerisinde kaldıkları sürece düzenleme için kullanılabilir. LLM, düzenleme aracını çağırırken ilgili tüm kimlikleri image_ids dizisine dahil eder.
Daha önce yüklenmiş görselleri tekrar yüklemenize gerek kalmadan yan panelden ekleyebilirsiniz. Bu aynı zamanda bir vision modeline görsel bağlamı sağlar ve bu da düzenleme aracı için prompt oluşturulmasına yardımcı olabilir.

Parametreler

Görsel Oluşturma

prompt: metin açıklaması (gerekli)
size: auto (varsayılan), 1024x1024 (kare), 1536x1024 (yatay) veya 1024x1536 (dikey)
quality: auto (varsayılan), high, medium veya low
background: auto (varsayılan), transparent veya opaque (transparent için PNG veya WebP formatı gerekir)

Görsel Düzenleme

image_ids: düzenleme için referans olarak kullanılacak görsel kimliklerinden (ID) oluşan dizi (zorunlu)
prompt: değişikliklerin metin açıklaması (gerekli)
size: auto (varsayılan), 1024x1024, 1536x1024, 1024x1536, 256x256 veya 512x512
quality: auto (varsayılan), high, medium veya low

Kurulum

Bir OpenAI anahtarı oluşturun veya mevcut olanı yeniden kullanın ve bunu .env dosyasına ekleyin, ardından "OpenAI Image Tools" öğesini temsilcinizin Tools listesine ekleyin:

IMAGE_GEN_OAI_API_KEY=sk-...
# optional extras
IMAGE_GEN_OAI_MODEL=gpt-image-1
IMAGE_GEN_OAI_BASEURL=https://...

Azure OpenAI dağıtımları için, önce https://aka.ms/oai/gptimage1access adresinden erişim talebinde bulunun, ardından kimlik bilgilerinizi .env dosyasına ekleyin:

IMAGE_GEN_OAI_API_KEY=your-api-key
# optional extras
IMAGE_GEN_OAI_MODEL=gpt-image-1
IMAGE_GEN_OAI_BASEURL=https://deploymentname.openai.azure.com/openai/deployments/gpt-image-1/
IMAGE_GEN_OAI_AZURE_API_VERSION=2025-04-01-preview

Gelişmiş Yapılandırma

Araç açıklamalarını ve istem rehberliğini şu ortam değişkenleri ile özelleştirin:

# Image Model
IMAGE_GEN_OAI_MODEL=gpt-image-1

# Image Generation Tool Descriptions
IMAGE_GEN_OAI_DESCRIPTION=...
IMAGE_GEN_OAI_PROMPT_DESCRIPTION=...

# Image Editing Tool Descriptions
IMAGE_EDIT_OAI_DESCRIPTION=...
IMAGE_EDIT_OAI_PROMPT_DESCRIPTION=...

Fiyatlandırma

Görüntü oluşturma maliyetleri için GPT-Image-1 fiyatlandırma sayfasına ve Görüntü Oluşturma belgelerine bakın.

Gemini Görüntü Araçları

Gemini Image Tools, Google'ın en son görüntü oluşturma modellerini entegre ederek hem metinden görüntü oluşturmayı hem de görüntü bağlamına duyarlı düzenlemeyi destekler.

Metinden görsele oluşturma: ayrıntılı metin açıklamalarından yüksek kaliteli görseller oluşturun.
Görsel bağlam desteği: yeni nesiller için mevcut görselleri bağlam veya ilham kaynağı olarak kullanın.
Görsel düzenleme: mevcut görseller üzerinde yapılan değişikliklere dayalı olarak yeni görseller oluşturun (orijinal görsel kimliğini dahil edin).
Çoklu modeller: gemini-2.5-flash-image (varsayılan) veya gemini-3-pro-image-preview seçeneklerinden birini belirleyin.
İkili API desteği: hem basit Gemini API anahtarları hem de Google Cloud Vertex AI ile çalışır.

Parametreler

prompt: istenen görselin ayrıntılı metin açıklaması (zorunlu, 32.000 karaktere kadar)
image_ids: üretim için görsel bağlam olarak kullanılacak isteğe bağlı bir görsel kimlikleri (image IDs) dizisi

Kurulum

Gemini API için Google AI Studio üzerinden bir anahtar alın:

GEMINI_API_KEY=your_api_key_here

Vertex AI için (Vertex AI erişimi olan Google Cloud kullanıcıları):

GOOGLE_SERVICE_KEY_FILE=/path/to/service-account.json
GOOGLE_CLOUD_LOCATION=us-central1  # optional, default: global

Model Seçimi

# Default model (fast and efficient)
GEMINI_IMAGE_MODEL=gemini-2.5-flash-image

# Higher quality model
GEMINI_IMAGE_MODEL=gemini-3-pro-image-preview

Gelişmiş Yapılandırma

Araç açıklamalarını ortam değişkenleri aracılığıyla özelleştirin:

GEMINI_IMAGE_GEN_DESCRIPTION=...
GEMINI_IMAGE_GEN_PROMPT_DESCRIPTION=...
GEMINI_IMAGE_IDS_DESCRIPTION=...

Daha fazla ayrıntı, özel Gemini Image Gen kılavuzunda mevcuttur.

DALL·E (eski)

DALL·E, OpenAI'in dall-e-3 görüntü modelini kullanarak eski nesil görüntü oluşturma imkanı sağlar.

Parametreler

prompt: istenen görselin metin açıklaması (zorunlu, 4000 karaktere kadar)
style: vivid (hiper-gerçekçi, dramatik, varsayılan) veya natural (daha az hiper-gerçekçi)
quality: standard (varsayılan) veya hd
size: 1024x1024 (varsayılan, kare), 1792x1024 (geniş) veya 1024x1792 (dikey)

Kurulum

# Required
DALLE_API_KEY=sk-...  # or DALLE3_API_KEY=sk-...

# Optional
DALLE_REVERSE_PROXY=https://...  # Alternative endpoint
DALLE3_BASEURL=https://...  # For Azure or custom endpoints
DALLE3_AZURE_API_VERSION=2023-12-01-preview  # For Azure deployments
DALLE3_SYSTEM_PROMPT=...  # Custom system prompt for DALL·E

Ajan için DALL·E aracını etkinleştirin ve komut istemeye başlayın.

Gelişmiş Yapılandırma

Azure OpenAI dağıtımları için, temel URL'yi (base URL) ve API sürümünü yapılandırın:

DALLE3_BASEURL=https://your-resource-name.openai.azure.com/openai/deployments/your-deployment-name
DALLE3_AZURE_API_VERSION=2023-12-01-preview
DALLE3_API_KEY=your-azure-api-key

Fiyatlandırma

Görsel oluşturma maliyetleri için DALL-E fiyatlandırma sayfasına ve Görsel Oluşturma belgelerine bakın.

Stable Diffusion (yerel)

Görüntüleri tamamen kendi makinenizde veya sunucunuzda çalıştırın. LibreChat'i herhangi bir Automatic1111 (veya uyumlu) endpoint noktasına yönlendirmeniz yeterlidir.

Parametreler

prompt: görüntüde istenen öğeleri tanımlayan ayrıntılı anahtar kelimeler (gerekli)
negative_prompt: görüntüden hariç tutulacak öğeleri tanımlayan anahtar kelimeler (gerekli)

Stable Diffusion uygulaması, çoğu kullanım durumu için iyi sonuçlar veren şu sabit varsayılan parametreleri kullanır:

cfg_scale: 4.5
adımlar: 22
width: 1024
height: 1024

Kurulum

Herhangi bir API anahtarı gerekmez, sadece Automatic1111 WebUI'nızın erişilebilir URL'si yeterlidir:

SD_WEBUI_URL=http://127.0.0.1:7860  # URL to your Automatic1111 WebUI

Automatic1111 kurulumu hakkında daha fazla ayrıntı, özel Stable Diffusion rehberinde mevcuttur.

Flux

Hız ve isteğe bağlı ince ayarlı modellere odaklanan bulut oluşturucu.

Hızlı bulut tabanlı görsel oluşturma
İnce ayar yapılmış (fine-tuned) modeller için destek
Birden fazla kalite seviyesi ve en boy oranı
Daha az işlenmiş, daha doğal görünen görseller için Raw modu

Parametreler

Flux aracı üç ana işlemi destekler:

generate: bir metin isteminden yeni bir görsel oluşturur
generate_finetuned: ince ayar yapılmış bir model kullanarak görsel oluşturma
list_finetunes: kullanıcı için mevcut özel modelleri listeler

Daha fazla ayrıntı, özel Flux rehberinde mevcuttur.

Kurulum

Ajan içindeki Flux aracını seçin. İstemler düz metindir ve tek bir çağrı bir görsel üretir.

FLUX_API_KEY=flux_live_...
FLUX_API_BASE_URL=https://api.us1.bfl.ai   # default is fine for most users

Fiyatlandırma

Görsel oluşturma maliyetleri için Flux fiyatlandırma sayfasına bakın.

Model Context Protocol (MCP)

MCP sunucularından görüntü çıktıları desteklenmektedir. Örneğin, Puppeteer MCP Server web sayfalarının ekran görüntülerini oluşturabilir; bu görüntüler beklenen formatta çıktı verir ve LibreChat'in yerleşik görüntü araçlarıyla aynı şekilde işlenir.

MCP görüntü desteği henüz gelişme aşamasındadır

Aşağıdaki örnekler, LibreChat'in Docker dışında, doğrudan Node.js kullanılarak çalıştırıldığını varsaymaktadır. Model Context Protocol nispeten yeni bir çerçevedir ve birçok geliştirici, ölçeklenebilir dağıtım için sistemlerini uv/node ile nasıl sunacaklarını hâlâ öğrenmektedir.
Görsel oluşturan çok az sunucu bulunmaktadır ve birçoğu henüz görseller için doğru yanıt formatını benimsememiştir.
Birçok MCP sunucusu Docker içinde iyi çalışsa da, aşağıdaki örnekler çalışmamakta veya daha gelişmiş yapılandırmalar olmadan çalışmamakta olup, MCP sunucuları arasındaki mevcut tutarsızlıkların bazılarını göstermektedir.

mcpServers:
  puppeteer:
    command: npx
    args:
      - -y
      - '@modelcontextprotocol/server-puppeteer'

The following is an example of an Image Generation server that outputs images using the Replicate API, but returns URLs of the images, which doesn't conform to MCP's image response standard.

Global kurulum gerekli

Bu özel sunucu için, @gongrzhe/image-gen-server paketini npm install -g @gongrzhe/image-gen-server komutuyla global olarak yükleyin ve ardından aşağıda gösterildiği gibi paketin derlenmiş dosyalarını işaret edin.

mcpServers:
  image-gen:
    command: 'node'
    # First, install the package globally using npm:
    # `npm install -g @gongrzhe/image-gen-server`
    # Then, point to the location of the installed package,
    # which you can find by running `npm root -g`
    args:
      - '{REPLACE_WITH_NODE_MODULES_LOCATION}/@gongrzhe/image-gen-server/build/index.js'
      # Example with output from `npm root -g`:
      # - "/home/danny/.nvm/versions/node/v24.16.0/lib/node_modules/@gongrzhe/image-gen-server/build/index.js"
    env:
      # Do not hardcode the API token here, use the environment variable instead
      # The following will pick up the token from your .env file or environment
      REPLICATE_API_TOKEN: '${REPLICATE_API_TOKEN}'
      MODEL: 'google/imagen-3'

Görsel Depolama ve İşleme

Oluşturulan tüm görseller:

Yapılandırılmış fileStrategy uyarınca kaydedildi
Doğrudan sohbet arayüzünde görüntülenir
Üretimden sonra anlık sohbet bağlamının bir parçası olarak LLM'e gönderilir

Son madde için birkaç uyarı geçerlidir:

Bu durum, görüntü girişlerini desteklemeyen bir LLM ile sorunlara yol açabilir. Temsilci bazında bu davranışı devre dışı bırakma seçeneği planlanmaktadır.
Çıktılar, her mesajda değil, yalnızca oluşturma sırasında LLM'e gönderilir.
Daha sonraki turlara bir görsel eklemek için, görseli yan panelden mesaja iliştirin.
Kısacası, LLM görsel bağlamını yalnızca kullanıcı mesajlarına eklenen görsellerden ve bu görsellerin hemen ardından gerçekleşen üretimlerden veya düzenlemelerden alır.

Proxy Desteği

Tüm görsel oluşturma araçları, PROXY ortam değişkeni aracılığıyla proxy yapılandırmasını destekler:

PROXY=http://proxy-url:port

PROXY ayarlanmadığında, desteklenen sunucu tarafı istemcileri HTTP_PROXY, HTTPS_PROXY ve NO_PROXY/no_proxy değişkenlerini dikkate alır.

Hata Yönetimi

Bir araç bir hatayla karşılaşırsa, neyin yanlış gittiğini açıklayan bir mesaj döndürür. Yaygın sorunlar şunları içerir:

Geçersiz API anahtarı
API kullanılamıyor
İçerik politikası ihlalleri
Proxy/ağ sorunları
Geçersiz parametreler
Desteklenmeyen görüntü yükü (yukarıdaki Image Storage and Handling bölümüne bakın)

İstem Oluşturma (Prompting)

OpenAI Image Tools ve DALL·E için istemleri özelleştirebilirsiniz, ancak aşağıdaki ipuçları araçların sağladığı varsayılan istemler hakkında bilgi verir; bu da kendi yazımlarınız için bilmeniz gereken yararlı bilgilerdir:

Konu ve stil (fotoğraf, yağlı boya vb.) ile başlayın.
Kompozisyon ve kamera/medya ("...geniş açılı çekim", "suluboya...") ekleyin.
Aydınlatma ve atmosferden ("golden hour", "dramatic shadows") bahsedin.
Detay anahtar kelimeleri (dokular, renkler, ifadeler) ile bitirin.
Olumsuzları olumlu tutun: neyden kaçınılması gerektiğini değil, nelerin dahil edilmesi gerektiğini tanımlayın.

Örnek:

Sıcak öğleden sonra güneş ışığıyla yıkanan antika bir kütüphanenin sinematik fotoğrafı. Uzun ahşap raflar deri ciltli kitaplarla dolu ve toz zerreleri ışıkta parlıyor. Ön planda, cilalı maun bir masa üzerindeki açık bir atlası, yeşil abajurlu tek bir bankacı lambası aydınlatıyor. 85 mm lens, sığ alan derinliği, zengin kehribar tonları, ultra yüksek detay.

Ajanlar

Özel araçlarla AI ajanları oluşturun ve yapılandırın

→

MCP Sunucuları

Model Context Protocol aracılığıyla kendi araçlarınızı getirin

→

Gemini Görsel Araçları

Google Gemini görsel oluşturma için ayrıntılı kurulum kılavuzu

→

Görsel Oluşturma ve Düzenleme

Ajanlar

MCP Sunucuları

Gemini Görsel Araçları

Bu sayfada