Stanford Üniversitesi ile Washington Üniversitesi bünyesinde çalışmalarını sürdüren bilim insanları, yapay zekâ bölümünde tüm istikrarları alt üst etme potansiyeline sahip olan yeni bir model geliştirdiler. “S1” olarak isimlendirilen bu model, OpenAI’ın akıl yürütebilen yapay zekâ modeli o1’e rakip olarak tasarlandı. Fakat buradaki en değerli fark, S1’in eğitimi için sadece 20 dolar civarında para harcanmış olması.
İşin daha da değişik yanı, S1’in performansının beklentileri aşıyor olması. S1, girdiği matematik ve kodlama testlerinde hem OpenAI o1 hem de DeepSeek R1 modellerine yakın performans gösterdi. E madem bu kadar başarılı yapay zekâ modelleri bu kadar uygun fiyatlar karşılığında tasarlabiliyor, OpenAI üzere dal devleri neden yapay zekâ için çuval çuval para harcıyorlar?
S1, alıştığımız yapay zekâ modellerinden biraz daha farklı bir eğitim sürecinden geçti
Bilim insanları, S1 modelinin temelini Alibaba tarafından desteklenen yapay zekâ girişimi Qwen‘den aldılar. Firmanın geliştirdiği ve fiyatsız olarak yayımladığı bir modele erişen bilim insanları, ikinci etapta da Google’ın akıl yürütebilen ve kısıtlamalar olsa da fiyatsız olarak kullanılabilen modeli Gemini 2.0 Flash Thinking Experimental’dan yardım aldılar. Bu noktada dikkatlice seçilmiş 1.000 adet soru ayarlayan uzmanlar, Gemini 2.0 Flash Thinking Experimental’ın düşünme sürecini, kendi modellerine entegre ettiler.
Araştırmalara nazaran S1 modelinin eğitimi için yalnızca 16 adet NVIDIA H100 GPU kullanıldı. Üstelik eğitim süreci yaklaşık olarak 30 dakika sürdü. Stanford Üniversitesi’nden Niklas Muennighoff, tüm bu süreç için 20 dolarlık harcamanın kâfi olabileceğini belirtti.
Tabii burada tartışmamız gereken bir konu var. OpenAI, DeepSeek’i kendilerine ilişkin bilgileri izinsiz kullanmakla suçlamıştı. Google ise kendi yapay zekâ modellerinin rakip modeller üretmek için kullanılmasını yasaklıyor. İşte bilim insanlarının S1 modelinin bu cins tartışmalara mevzu olup olmayacağı şimdilik belirsiz. Sonuçta gelinen son nokta, aslında isteyen herkesin hayli düşük fiyatlarla kendi akıl yürütebilen yapay zekâ modelini geliştirebileceği manasına geliyor.