Google, yeni yapay zekâ modeli PaliGemma 2’yi duyurdu. Modelin en dikkat alımlı özelliği, görsellerdeki şahısların hislerini tanıyabilme yeteneği. Fakat bu özellik henüz fonksiyonel olarak kullanılabilir durumda değil.
PaliGemma 2, imgeleri tahlil edebiliyor ve gördüğü bireylerle ilgili açıklamalar yapabiliyor. PaliGemma 2, evvelki sürümün geliştirilmiş hali olarak, manzaralardaki aksiyonları, hisleri ve öyküyü daha ayrıntılı halde tanımlama yeteneğine sahip.
PaliGemma 2 özellikleri
Google, PaliGemma 2 modelinin görselleri ayrıntılı formda tahlil ederek, sahnelerdeki aksiyonları, hisleri ve genel kıssayı tanımladığını açıkladı. Lakin modelin duygusal tespit özelliği şimdi başlangıç evresinde ve tam manasıyla kullanılamıyor.
PaliGemma 2, görsel içeriklere daha kapsamlı başlıklar ekleyerek kolay obje tanımalarının ötesine geçebilmeyi hedefliyor. Artık sahnedeki aksiyonları, hisleri ve genel öyküyü hakikat bir formda tanımlayabilen model, 3B, 10B ve 28B parametre seçenekleriyle sunuluyor. Ayrıyeten, manzaraların çözünürlük seçenekleri 224px, 448px ve 896px olarak belirlenmiş durumda. PaliGemma 2’nin sağladığı öteki avantajlar ortasında, optik karakter tanıma (OCR) ve evraklardaki tabloların yapısını manaya yer alıyor. PaliGemma 2 bilhassa kimyasal formül tanıma, müzik notası tanıma ve göğüs röntgeni raporu üretme üzere alanlarda tahlil sunabiliyor olacak.
PaliGemma 2’nin his tanıma özelliği, şimdi tam olarak kullanıma sunulmadan evvel değerli etik tartışmaları beraberinde getiriyor. Uzmanlar, bu teknolojinin yanlış kullanımı durumunda çeşitli toplumsal meselelere yol açabileceği konusunda ikazlarda bulunuyor. Bu cins gelişmelerin ilerleyen devirlerde daha geniş kapsamlı etik değerlendirmelere tabi tutulması bekleniyor.