Yapay zeka Büyük Dil Modelleri (LLM) için performans testleri yapan bağımsız LiveBench platformunun verilerine göre, Qwen3 model ailesi açık kaynak modellerinde yapılan testlerde en iyi performansı sergiledi.
Qwen3, kodlama, matematik ve veri analizi alanlarında DeepSeek’in R1 modelini geride bırakmayı başardı.
Alibaba, 8 gelişmiş yapay zeka modelinden oluşan ve 600 milyondan 235 milyara kadar parametreye sahip olan Qwen3 ailesini nisan ayında piyasaya sürmüştü.
Qwen3, önceki testlerde ABD’li yapay zeka şirketi OpenAI’ın o1 ve Çinli yapay zeka şirketi DeepSeek’in R1 modellerini geçerek üstün performans sergilemişti.
Çin’de yapay zeka sektörü hızla büyüyor
Bu yıl Çin’den çıkan iki modelin açık kaynaklı modeller arasında öne çıkması, ülkedeki yapay zeka sektöründeki yoğun rekabeti ve hızlı büyümeyi gösteriyor.
Çin merkezli High-Flyer Quant yatırım fonu tarafından desteklenen DeepSeek, düşük maliyet ve az sayıda çip kullanarak geliştirdiği açık kaynaklı yeni modeli R1’i 20 Ocak’ta piyasaya sürmüştü.
Dünya genelinde hızla popüler hale gelen yapay zeka modeli, ABD merkezli ChatGPT’yi geride bırakarak en çok indirilen yapay zeka uygulaması olmuştu.
DeepSeek’in yapay zeka modelinin, ABD’de büyük yatırımlarla geliştirilen muadillerinden daha düşük maliyetle daha iyi performans sergilemesi, teknoloji endüstrisinde yankı uyandırmış ve teknoloji hisselerinde satış baskısına neden olmuştu.
Yapay zeka modelinin başarısı, ABD ile Sovyetler Birliği arasında uzay yarışını tetikleyen olay olan Sovyetler’in 1957’de Sputnik uydusunu fırlatmasına benzetilerek, ABD ile Çin arasındaki rekabette yapay zeka alanında bir yarışı başlatacak bir “Sputnik anı” olarak görülmüştü.