في واقعة وُصفت بأنها غير مسبوقة في تاريخ الذكاء الاصطناعي، شهدت مدينة بيركلي بولاية كاليفورنيا منتصف مايو 2025 حدثًا فريدًا من نوعه، حيث اجتمع نحو ثلاثين من أبرز علماء الرياضيات في العالم في لقاء مغلق لاختبار قدرات نموذج لغوي جديد طورته شركة OpenAI تحت اسم (o4-mini)، صُمم خصيصًا لمعالجة المسائل الرياضية المعقدة والاستدلال المنطقي المتقدم. على مدى يومين من التجارب المتواصلة، فوجئ العلماء بقدرة النموذج على حل بعض أعقد المسائل الرياضية في العالم، مع تقديم شروحات دقيقة لخطوات الحل، ما دفع العديد منهم لوصف أدائه بالـ“عبقري”.
وقال البروفيسور كين أونو من جامعة فيرجينيا:
«لدي زملاء قالوا حرفيًا إن هذه النماذج تقترب من العبقرية الرياضية».
النموذج الجديد، الأخف وزنًا والأسرع أداءً بين إصدارات OpenAI، تم تدريبه على مجموعات بيانات رياضية متخصصة بإشراف بشري مكثف، مما مكنه من بلوغ مستويات غير مسبوقة في التحليل المنطقي والاستدلال الرياضي، متجاوزًا حدود قدرات روبوتات الدردشة التقليدية.
لمعرفة مدى دقة واستقلالية النموذج، كلّفت OpenAI منظمة Epoch AI غير الربحية بإعداد مجموعة من 300 مسألة رياضية جديدة غير منشورة ضمن مشروع أطلق عليه اسم FrontierMath.
وبينما فشلت معظم النماذج السابقة في حل أكثر من 98٪ من هذه المسائل، حقق (o4-mini) معدل نجاح لافت بلغ 20٪، وهو رقم اعتبره الباحثون قفزة ثورية في مجال الاستدلال الآلي.
قاد التقييم الدكتور إيليوت غليزر، الذي أعدّ وفريقه مسائل تتراوح بين مستوى البكالوريوس ومستوى الأبحاث العليا. وفي أبريل 2025، أثبت النموذج قدرته على حل مسائل تتحدى حتى المتخصصين في الرياضيات النظرية.
في الاجتماع السري ذاته، جرى تنظيم تحدٍّ مباشر بين العلماء والنموذج، حيث انقسم الحاضرون إلى فرق من ستة أشخاص، هدفهم ابتكار مسائل يعجز الذكاء الاصطناعي عن حلها، مقابل جائزة قيمتها 7500 دولار لكل من ينجح في ذلك.
لكن المفاجأة كانت مدوية: النموذج حل مسائل بمستوى الدكتوراه خلال عشر دقائق فقط، في حين يحتاج الإنسان إلى أسابيع أو حتى شهور لإنجازها.
ويروي كين أونو تجربته قائلًا:
«وضعتُ مسألة مفتوحة في نظرية الأعداد، وعندما عرضتُها على (o4-mini) قدّم حلاً كاملاً خلال دقائق، بل ختم بقوله: “لا حاجة إلى مصدر، لأن الرقم الغامض حسبته بنفسي.”»
ويضيف أونو في رسالة وجهها عبر تطبيق Signal لزملائه بعد الاجتماع:
«لم أرَ من قبل مثل هذا النوع من الاستدلال في النماذج. إنه أمر مخيف حقًا.»
ورغم أن العلماء تمكنوا في النهاية من صياغة عشر مسائل فقط فشل النموذج في حلها، فإن الشعور السائد بينهم كان مزيجًا من الإعجاب والقلق.
وقال الباحث يانغ هوي من معهد لندن للعلوم الرياضية:
«هذا النموذج يفكر مثل طالب دراسات عليا موهوب جدًا… بل ربما أفضل منه.»
ومع ذلك، حذر أونو وهي من الثقة المفرطة في هذه النماذج، مشيرَين إلى ظاهرة “البرهان بالتخويف” — أي تحدث الذكاء الاصطناعي بثقة مطلقة حتى عندما يكون على خطأ، وهو ما قد يربك التقييم العلمي الموضوعي.
مع نهاية اللقاء، تحول النقاش إلى ما أطلق عليه الحاضرون “المستوى الخامس من التطور”، وهو المرحلة التي يتجاوز فيها الذكاء الاصطناعي قدرات كبار علماء الرياضيات، فيتحول دور الإنسان من الحل إلى توجيه الأسئلة وتنسيق الاكتشافات، كما يفعل الأستاذ الجامعي مع طلابه.
وختم أونو حديثه بالقول:
«من الخطأ الاعتقاد أن الذكاء الاصطناعي العام لن يأتي أبدًا. في بعض الجوانب، هذه النماذج تجاوزت بالفعل أداء معظم طلاب الدراسات العليا في العالم.»

