Aynı formda Gemini de ChatGPT’nin rakibi olma konusunda aday durumda. Pekala bu üç büyük yapay zekâ modeli, görsel yeteneklerde de tıpkı yeteneklere sahipler mi?
Görsel bilgilerin yapay zekâ tarafından işlenmesi, günümüzde kullanıcı tecrübesinin ayrılmaz bir modülü hâline geldi. ChatGPT, GPT-4V entegrasyonuyla fotoğraflardaki objeleri tanımlayabilirken Google Gemini, çoklu modal yaklaşımıyla görsel ve metni birleştirerek âdeta “düşünen bir göz” fonksiyonu görüyor. Pekala DeepSeek, bu rekabetin neresinde yer alıyor?
Üç modelin de görsel sürece yeteneklerini tek tek test ettik.
Gemini, ChatGPT ve DeepSeek’e tamamen tıpkı promptları girerek görseller oluşturduk. Bakalım hangi modelin görsel sürece yeteneği başkalarından daha âlâ?
İlk olarak gün batımında, sakin bir gölün etrafında yeşilliklerle kaplı dağlar, gökyüzü turuncu ve pembe tonlarda, suyun üzerinde hafif bir sis ve göl kenarında renkli çiçekler, gerçekçi ve huzur dolu bir atmosfer çizmelerini istedik.
Gemini
ChatGPT
DeepSeek
İkinci olarak kolay bir köpek çizimi istedik.
“Güneşli bir parkta oturan dost canlısı ve oyuncu bir Golden Retriever yavrusunun detaylı bir imgesini oluşturun. Köpeğin Güneş ışığında parıldayan yumuşak, meraklı gözleri ve şakacı bir biçimde dışarı çıkmış lisanı olsun. Yavru köpeğin etrafında yeşil çimenler, rengarenk çiçekler ve top ve frizbi üzere dağınık birkaç oyuncak var. Art planda uzun ağaçlar ve berrak mavi bir gökyüzü var ve bu da sevinçli ve canlı atmosfere katkıda bulunsun.”
Gemini
ChatGPT
DeepSeek
Bu sefer de ülkemizin hoşluklarından devam ettik.
“Türkiye’nin kültürel ve doğal hoşluklarının bir karışımını sergileyen ikonik görünümünün detaylı bir manzarasını oluştur. Eşsiz kaya oluşumlarını ve gün doğumunda Kapadokya üzerinde süzülen sıcak hava balonlarını, sahneyi aydınlatan yumuşak altın ışıkla birlikte ekle. Ön planda karmaşık desenli bir halı ve küçük bir masa üzerinde dumanı tüten bir fincan Türk çayı tasvir et. Art planda ülkenin varlıklı mirasını ve nefes kesici görüntüsünü vurgulayan uzak dağlar ve açık bir gökyüzü yer alsın.”
Gemini
ChatGPT
DeepSeek
Biraz da hayal güçlerini konuşturalım…
“Uzak bir gezegendeki uzaylı görünümünün detaylı bir imajını oluştur. Sahnede mavi ve morun canlı tonlarıyla parlayan, biyolüminesan bitkilerden oluşan diğer bir dünyaya ilişkin ormanla çevrelenmiş yüksek kristal yapılar yer alsın. Gökyüzü, manevî bir ışık saçan iki Güneş’le dolu ve devasa halkalı bir gezegen ufka hâkim oluyor. Yarı saydam bedenlere ve yumuşak, ışıltılı parıltılara sahip canlılar havada zarafetle hareket ederek bu gerçeküstü ve dünya dışı ortama bir ömür ve gizem duygusu katsın.”
Gemini
ChatGPT
DeepSeek
Metin odaklı çıkış yapan DeepSeek, bariz bir biçimde görsel sürece konusunda Gemini ve ChatGPT’nin biraz altında kalıyor. Lakin ilerleyen vakitlerde geliştirilen modeli, her ikisinin de önüne geçebilir mi bilmiyoruz.
Siz bu üç modelin görsel sürece yeteneğini nasıl buldunuz? Yorumlarda bizimle paylaşmayı unutmayın!
İlginizi çekebilir: