Bir müddettir yapay zekâ bölümündeki çalışmalarına sürat veren Çinli e-ticaret devi Alibaba, “Qwen2.5-Max” olarak isimlendirdiği yeni yapay zekâ modelini duyurdu. Qwen2.5 üzerine inşa edilen yeni model, Alibaba’nın bile Çinli yapay zekâ teşebbüsü DeepSeek’ten tedirgin olmaya başladığını gözler önüne seriyor. Çünkü Alibaba, Çin’de tatil devrine girilmiş olunan bir devirde bu duyuruyu gerçekleştirdi.
Alibaba’nın WeChat üzerinden yaptığı duyuruya göre Qwen2.5-Max, DeepSeek-V3, GPT 4o ve Llama-3.1-405B modellerinden daha uygun performans gösteriyor. Şirket bu açıklamayı yapabilmek için yeni yapay zekâ modelini çeşitli testlere soktu ve elde edilen sonuçlar, yapılanan açıklamanın gerçek olduğunu gözler önüne seriyor.
İşte Qwen2.5-Max için yayımlanan test sonuçları
Qwen2.5-Max’in girdiği testlere baktığımız vakit en etkileyici sonucun Arena-Hard testinde alındığını görüyoruz. LiveBench testinde de tüm rakiplerini geride bırakan yapay zekâ modeli MMLU-Pro tesinde üçüncü, GPQA-Diamond ile LiveCodeBench testlerinde ise ikinci oldu. Yapay zekânın birinci olduğu Arena-Hard testinin insan tercihlerini kestirim etmeye yönelik olduğunu belirtelim. Yani Qwen2.5-Max, rakiplerine kıyasla en çok insan üzere düşünebilen yapay zekâ modeli oldu.
Alibaba, yeni yapay zekâ modelini burada bulunan temas üzerinden ulaşabileceğiniz Owen Chat arayüzü üzerinden erişime açmış durumda. Yeni modelin gerçek kullanımda neler sunacağı, kullanıcılar tarafından yapılacak testler ile gün yüzüne çıkmış olacak.