Yapay zekâ bölümünün yaygınlaşması ile çabucak her gün Meta, Google, OpenAI yahut Microsoft üzere dev şirketlerin yaptığı çalışmalardan bahseder olduk. Lakin son bir haftadır gündemdeki bir numaralı isim Çinli yapay zekâ teşebbüsü DeepSeek.
Peki DeepSeek, nasıl bu türlü bir noktaya geldi? Bu teknoloji teşebbüsünü kimler destekliyor? Piyasaya sürdüğü yapay zekâ modelleri tüketicilere neler vadediyor? Gelin daima birlikte Çin’in yapay zekâ teşebbüsünü yakından tanıyalım.
DeepSeek kime ilişkin? Firma, parayı nereden buluyor?
2023 yılında kurulan DeepSeek, bağımsız olarak hizmet veriyor lakin ardındaki isim hem fon hem de yapay zekâ bölümünde değerli olan Wenfeng. Wenfeng’in DeepSeek’e sunduğu fonlar, şirketin kimseye muhtaç olmadan çalışmasını sağlıyor.
Şirketin dikkat cazip özelliklerinden bir tanesi, işe alım süreçleri. Çin’in en yeterli üniversitelerinde eğitim gören genç yetenekleri işe alan DeepSeek, iş tecrübesine bakmıyor. Teknik maharetler öne çıkıyor ve bu da şirketin, gerçekten yarar sağlayacak şahıslara ulaşmasını sağlıyor.
DeepSeek nasıl ortaya çıktı? Hangi yapay zekâ modellerini geliştirdi?
DeepSeek’in yapay zekâ serüveni, Kasım 2023’te başladı. Şirketin kullanıma sunduğu birinci model, DeepSeek Coder‘dı. İsminden da anlaşılabileceği üzere kodlamaya odaklanan model, yayımlandığı devir ses getirmişti. Durmak nedir bilmeden çalışan geliştirici takım, daha sonra 67 milyar parametli DeepSeek LLM modelini tanıttı. Mayıs 2024’te kullanıma sunulan DeepSeek-V2 (sonradan DeepSeek-Coder-V2 olarak isimlendirildi) modeli ise güçlü ve uygun fiyatlı olması nedeniyle dikkatleri üzerine çekti. Hatta bu model, Çin’deki rakip firmaların yapay zekâ dalındaki fiyatları düşürmesine neden oldu.
Şirketin yapay zekâ bölümündeki en büyük işi ise DeepSeek-V3 ve DeepSeek-R1 modelleri oldu. DeepSeek-V3 671 milyar parametresi ile etkileyici bir performans sunarken DeepSeek-R1, akıl yürütebilen yapısı ile OpenAI’ın o1 modeline karşı geliştirilen en büyük modellerden biri olarak kayıtlara geçti.
Yenilikçi teknikler uyguluyor
DeepSeek’in bu kadar büyük ses getirmesine neden olan şeylerin başında yenilikçi teknikler uygulaması geliyor. Klâsik eğitimlerin tersine yapay zekâ modellerinin deneme yanılma yapmasına müsaade veren geliştiriciler, modelin kendini yetiştirmesine müsaade veriyor. Ve bir modelin performansı, geri bildirim ile destekleniyor. Böylece DeepSeek, yapay zekâ modelini aslında bir insan üzere eğitmiş oluyor.
Geliştirilen yapay zekâ modellerindeki dikkat cazip özelliklerden bir tanesi de algoritmanın çalışma mantığı. DeepSeek modelleri, yalnızca gereksinim duyulan bilgiler üzerinde çalışıyor ve bu da hem performansı hem de maliyeti güzelleştiriyor. İşte bunlar üzere yenilikçi çalışmalar, verimliliği artırıyor. Şirket, tüm bunlara paralel olarak eğitim maliyetlerini düşürüyor. API fiyatlandırması düşük tutan ve açık kaynak kodu yapısını koruyan grup, rakiplerini koşeye sıkıştırmış oluyor.
Tüm bunları yaparken, çeşitli zorluklarla uğraşıyor
Yapay zekâ dalında değerli işler yapan DeepSeek, bazı zorluklarla da karşı karşıya. Öbür her şeyden evvel daha 2023 yılında kurulan bir teşebbüs, onlarca yıldır hizmet veren Google ve Microsoft üzere firmalarla rekabet etmeye çalışıyor. Ayrıyeten beşerler, DeepSeek’i tanımıyorlar. Ve olağan bu firmanın Çin merkezli olması, karşılaşılan zorluklardan biri. Bilirsiniz; şayet bir firma Çin merkezli ise Çin hükûmetine veri sızdırmakla suçlanır.
Her ne olursa olsun DeepSeek, yapay zekâ bölümüne çok güçlü bir giriş yaptı ve başta OpenAI olmak üzere bu dalda çalışan tüm firmaları köşeye sıkıştırmayı başaracak üzere görünüyor. Bakalım rakipleri, birkaç haftadır gündemden düşmeyen DeepSeek-R1 modeline karşı hangi atakları oynayacaklar…