منصة الصباح

اختبار الرياضيات لنموذج الذكاء الاصطناعي o3 يكشف كذب “OpenAI”

الصباح/ وكالات

كشفت اختبارات مستقلة أجراها معهد Epoch AI عن أداء أقل بكثير لنموذج الذكاء الاصطناعي “o3” الذي طورته شركة OpenAI في حل مسائل الرياضيات المعقدة، وذلك مقارنة بالنتائج التي سبق وأعلنتها الشركة.

وكانت OpenAI قد أشارت في ديسمبر الماضي، إلى أن نموذجها الجديد قادر على الإجابة على أكثر من 25% من أسئلة اختبار “FrontierMath” المتقدم، متفوقًا بذلك على النماذج المنافسة. غير أن نتائج معهد Epoch AI أظهرت أن الإصدار العام من النموذج لم يتجاوز حاجز 10% من الإجابات الصحيحة.

وأوضح المعهد أن، هذا التباين قد يعود إلى استخدام OpenAI نسخة تجريبية أقوى من النموذج خلال اختباراتها الداخلية، بالإضافة إلى احتمالية وجود اختلافات في الإعدادات الحوسبية أو عدد المسائل المستخدمة في كل اختبار.

وقد أكدت مؤسسة “ARC Prize” أيضًا أن النسخة التي اختبرتها قبل الإطلاق الرسمي كانت مختلفة عن النموذج المتاح للعامة، مشيرة إلى أن مستويات الحوسبة المطروحة للاستخدام العام أقل قوة.

شاهد أيضاً

علاج جديد يستهدف الخلايا السرطانية بدقة متناهية"د

علاج جديد يستهدف الخلايا السرطانية بدقة متناهية”د

برز علاج “CAR-T” كأحد أهم التطورات في مكافحة مرض السرطان، حيث تُؤخذ عينات من دم …