الصباح/ وكالات
كشفت اختبارات مستقلة أجراها معهد Epoch AI عن أداء أقل بكثير لنموذج الذكاء الاصطناعي “o3” الذي طورته شركة OpenAI في حل مسائل الرياضيات المعقدة، وذلك مقارنة بالنتائج التي سبق وأعلنتها الشركة.
وكانت OpenAI قد أشارت في ديسمبر الماضي، إلى أن نموذجها الجديد قادر على الإجابة على أكثر من 25% من أسئلة اختبار “FrontierMath” المتقدم، متفوقًا بذلك على النماذج المنافسة. غير أن نتائج معهد Epoch AI أظهرت أن الإصدار العام من النموذج لم يتجاوز حاجز 10% من الإجابات الصحيحة.
وأوضح المعهد أن، هذا التباين قد يعود إلى استخدام OpenAI نسخة تجريبية أقوى من النموذج خلال اختباراتها الداخلية، بالإضافة إلى احتمالية وجود اختلافات في الإعدادات الحوسبية أو عدد المسائل المستخدمة في كل اختبار.
وقد أكدت مؤسسة “ARC Prize” أيضًا أن النسخة التي اختبرتها قبل الإطلاق الرسمي كانت مختلفة عن النموذج المتاح للعامة، مشيرة إلى أن مستويات الحوسبة المطروحة للاستخدام العام أقل قوة.