Alibaba’nın Qwen ekibi, yeni yapay zekâ "akıl yürütme" modeli QwQ-32B-Preview’ı duyurdu. 32,5 milyar parametreli bu model, 32.000 kelimelik uzun metinleri işleyebilme yeteneğiyle dikkat çekiyor ve OpenAI’nin o1-preview ve o1-mini modellerine karşı üstün performans sergiliyor. Model, MATH ve AIME gibi testlerde OpenAI’nin modellerini geride bırakmayı başardı.
QwQ-32B-Preview: Akıl Yürütme ile Güçlü Performans
QwQ-32B-Preview, mantık bulmacalarını çözme ve matematiksel problemleri yanıtlayabilme özellikleriyle ön plana çıkıyor. Model, görevlerini çözmeden önce planlama yaparak sonuçlara ulaşırken, bu sürecin daha fazla zaman almasına yol açabiliyor. Ayrıca, QwQ-32B-Preview kendi kendini "gerçeklik kontrolü" ile denetleyerek yanlış bilgilerin yayılmasını azaltıyor.
Ancak, Alibaba modeli hakkında şu uyarılarda bulunuyor:
- Dil değiştirme veya döngüye girme gibi beklenmeyen davranışlar sergileyebilir.
- Genel mantık gerektiren konularda performansı düşük olabilir.
Çin Düzenlemelerine Uyumluluk
QwQ-32B-Preview, Çin’deki düzenleyicilerin belirlediği standartlara uygun şekilde geliştirilmiştir. Örneğin, model "Tiananmen Meydanı" gibi hassas konular hakkında yanıt vermekten kaçınırken, "Tayvan Çin’in bir parçası mı?" sorusuna Çin Komünist Partisi’nin resmi duruşuna uygun yanıtlar veriyor.
Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...