تفكير أطول وأخطاء قاتلة… كيف حسمت "أوبن إيه آي" مواجهة الشطرنج أمام "غروك"
شهدت منصة Kaggle المملوكة لشركة "غوغل" بين 5 و7 آب /أغسطس بطولة شطرنج غير مسبوقة، جمعت بين ثمانية نماذج لغوية كبرى (LLMs) من شركات عالمية، بينها "أوبن إيه آي" و"إكس إيه آي" و"غوغل" و"أنثروبيك"، إضافة إلى مطوّرين صينيين هما "ديبسيك" وMoonshot AI اللذان خرجا مبكراً من ربع النهائي.
في النهائي، تمكّن نموذج o3 من "أوبن إيه آي" من تحقيق فوز ساحق على "غروك "4 من شركة "إكس إيه آي"، التي أسّسها إيلون ماسك، بنتيجة 4-0، وفق ما أوردته صحيفة "الإندبندنت" البريطانية. وجاء الفوز بعد سلسلة أخطاء تكتيكية فادحة ارتكبها "غروك"، من بينها خسارة الملكة أكثر من مرة، فيما حافظ o3 على معدل دقّة تجاوز 91% في 12 مباراة.
وقال أحد المعلّقين في تغطية البطولة:
"الوهم انهار في اليوم الأخير من البطولة. الـo3 الثرثار فكّك خصمه الغامض بأربعة انتصارات مقنعة، بينما كان أداء غروك غير معهود، يخطئ سريعاً وكثيراً. وo3 أظهر قسوة واضحة".
وحلّ نموذج "جيمناي" من "غوغل" في المركز الثالث بفوزه على o4-mini بنتيجة 3.5–0.5. وقبيل المباراة النهائية، كتب ماسك عبر منصّة "إكس":
@xAI لم تبذل تقريباً أيّ جهد في الشطرنج.
This is a side effect btw. @xAI spent almost no effort on chess. https://t.co/p18DFFn35A
— Elon Musk (@elonmusk) August 5, 2025
الفروق التقنية والتحليل
في السياق، وخلال حديثه لـ"النهار"، أوضح كريستوف الزغبي، المؤسِّس والرئيس التنفيذي لشركة ZAKA، أن الفارق بين o3 و"غروك 4" لا يقتصر على الأداء في الشطرنج، بل يمتدّ إلى فلسفة التدريب وتقنيات التفكير المستخدمة.
فـo3 من "أوبن إيه آي" مُدرَّب بكثافة على تعزيز التعلّم (RL) فوق سلاسل التفكير، مع آلية "يفكّر قبل الإجابة" (long internal rollouts)، ويستخدم أدوات داخل سلسلة التفكير (تصفّح، بايثون، تحويل صور)، إضافة إلى نهج "المواءمة التفكيرية" لمراعاة سياسات السلامة أثناء التفكير.
أما "غروك 4" من "إكس إيه آي"، فقد وسّعت الشركة تدريب الـRL إلى "مقياس ما قبل التدريب" باستخدام عنقود Colossus، الذي يضمّ نحو 200 ألف وحدة GPU، مع تكامل أصيل للأدوات وبحث لحظي على الويب وداخل منصة X، إضافة إلى نسخة غروك 4 Heavy التي تعتمد الحساب المتوازي وقت الاستدلال لاختبار فرضيات متعددة بالتوازي.
ويشير الزغبي إلى أن أسلوب o3 في التفكير الأطول والتحقق الداخلي قلل من الأخطاء التكتيكية في لعبة ذات قواعد صارمة وتسلسل تكتيكي، حتى من دون الاعتماد على أدوات خارجية، وهو ما يفسّر تفوّقه في النهائي.
انعكاسات على مجالات أخرى
وبيّن الزغبي أن التدريب الذي يركز على التخطيط والتجزئة والتحقق باستخدام الأدوات يمكن أن ينتقل إيجابياً إلى مجالات أخرى مثل الرياضيات والبرمجة، كما تظهر بيانات o3 في تقدمه على اختبارات مثل SWE-Bench Verified. في المقابل، فإن الضبط الدقيق على لعبة واحدة لا يضمن تعميم المهارات، بينما المهارات المنهجية مثل البحث والتحقق وإدارة السياق واستخدام الأدوات قابلة للانتقال إلى مجالات أوسع.
وأضاف أن "إكس إيه آي" نفسها تربط تطور "غروك 4 " بتوسيع بيانات مكافئة قابلة للتحقق إلى "مجالات كثيرة" مع استخدام أدوات متكاملة، مما يعزز فرص نجاحه خارج نطاق الألعاب.
آفاق التطوير المستقبلية
وعمّا إن كانت هذه النماذج بلغت حدودها، أكد الزغبي أن كلاً من "أوبن إيه آي" و"إكس إيه آي" يرى أن المسار ما يزال مفتوحاً أمام التطوير.
فبطاقة o3 تشير إلى أن النموذج لم يصل بعد إلى مستوى "مرتفع" في مسار تحسين الذات، وأن أداءه في المهام المفتوحة والمعقدة ما يزال محدوداً، ما يترك مجالاً لتطوير الأدوات، زيادة وقت الاستدلال، تحسين الذاكرة، وتعدّد العوامل. أما إكس إيه آي، فتخطط لتوسيع الـRL وتعميق التعدد وقت الاستدلال، إضافة إلى تكامل أدوات وبحث أوسع، في إشارة واضحة إلى أن سقف القدرات لم يُبلغ بعد.
فوز "أوبن إيه آي" على "غروك 4" في بطولة Kaggle لم يكن مجرد إنجاز رياضيّ رقميّ، بل يعكس اختلافات جوهريّة في أساليب التدريب وآليات التفكير بين النماذج، وهي اختلافات قد تحدّد ملامح المنافسة المقبلة في سباق الذكاء الاصطناعي.
نبض