Çinli yapay zeka girişimi DeepSeek, Uluslararası Matematik Olimpiyatları’nda (IMO) üstün performans gösteren yeni modeli Math-V2’yi erişime açtı. Google ve OpenAI’nin kapalı erişim politikalarının aksine, şirket bu güçlü teknolojiyi Hugging Face ve GitHub üzerinden tüm geliştiricilere ücretsiz açık kaynaklı açarak küresel yapay zeka rekabetinde dikkat çekici bir adım attı.
%8’LİK BAŞARI EŞİĞİNİ AŞAN MODEL
Harvard ve UCLA’dan uzmanların değerlendirmelerine göre IMO, derin düşünme ve yaratıcılık gerektiren en zorlu matematik yarışmalarından biri. Math-V2’nin burada ve 2024 Çin Matematik Olimpiyatları’nda elde ettiği sonuç, yalnızca katılımcıların %8’inin ulaşabildiği bir başarı seviyesini temsil ediyor. Modelin farkı, doğru cevabı bulmanın ötesinde, çözümün mantığını şeffaf ve sistematik biçimde ortaya koyabilmesi.
KAPALI SİSTEMLERE KARŞI AÇIK KAYNAK HAMLESİ
DeepSeek’in stratejisi, sektördeki devlerle keskin bir karşıtlık oluşturuyor. Google DeepMind benzer başarıya sahip modellerini yalnızca premium abonelere sunarken, OpenAI CEO’su Sam Altman deneysel sistemlerini henüz halka açmayacaklarını açıklamıştı. DeepSeek ise bu bariyerleri kaldırarak ileri düzey matematiksel akıl yürütme yeteneklerini tüm araştırmacıların erişimine açıyor.
‘KENDİ KENDİNİ DOĞRULAMA’ YETENEĞİ
Math-V2’nin en dikkat çekici özelliklerinden biri, kendi kendini doğrulama kapasitesi. Çoğu yapay zeka yalnızca bilinen çözümleri teyit edebilirken, Math-V2 çözümü olmayan problemler için bile kendi yanıtlarını kontrol edebiliyor. Bu özellik, modeli karmaşık ve açık uçlu sorularda daha güvenilir hale getiriyor.
BİLİMSEL ARAŞTIRMALARDA YENİ UFUKLAR
South China Morning Post’un analizine göre DeepSeek’in bu adımı yalnızca bir yazılım paylaşımı değil; aynı zamanda bilimsel araştırmalar için güçlü bir katalizör. Gelişmiş matematiksel akıl yürütme yetenekleri, teorik problem çözmeden karmaşık simülasyonlara kadar pek çok alanda dönüştürücü bir etki yaratabilir. Şirket, standart ölçütleri aşarak gerçek yeniliği tetikleyen muhakeme becerilerini güçlendirmeyi hedefliyor.