من النماذج التقليدية إلى الوكلاء الأذكياء: قراءة في Gemini 3
شهد مجال الذكاء الاصطناعي خلال الأعوام الأخيرة سباقاً متسارعاً بين عددٍ من الفاعلين الرئيسيين، حيث تتقدّم شركات كبرى مثل "أوبن إيه آي" و"أنثروبيك" و "غوغل"، إلى جانب جهات أحدث من بينها "ديبسيك"، في تطوير نماذج أكثر قدرة على الفهم والتنفيذ. ومع هذا التطور، لم يعد التركيز محصوراً في تحسين قدرات توليد النصوص، بل يتجه على نحو متزايد نحو تطوير ما يُعرَف بـ"الذكاء الوكيلي" (Agentic AI)، أي الأنظمة التي تعمل بوكلاء قادرين على التخطيط والتنفيذ المتتابع والتعامل مع مهام معقّدة متعددة المراحل. وفي هذا الإطار، كشفت Google DeepMind عن نموذج Gemini 3 باعتباره الجيل الأحدث ضمن عائلة Gemini، مع تعزيز واضح في قدراته على الاستدلال والعمل المتعدّد الوسائط ودعم الاستخدامات القائمة على الوكلاء.
تفوّق في المنطق وتعدّد الوسائط
يركّز نموذج Gemini 3 — وفق البيانات التي نشرتها "غوغل" — على تعزيز القدرات التحليلية والمنطقية، حيث سجّل إصدار Gemini 3 Pro تحسّناً ملحوظاً على اختبارات قياسية تعتمدها "غوغل" في تقييم مهارات التفكير والاستدلال، بما في ذلك اختبارات تغطي مجالات علمية ورياضية. ويعتمد النموذج بنية متعددة الوسائط (multimodal) تتيح له التعامل المتزامن مع النصوص والصور والفيديو والصوت، إضافة إلى قدرته على فهم محتوى مكتوب بخط اليد، وهو ما تشير إليه أمثلة قدمتها الشركة في عروضها التقنية. وتهدف هذه القدرات إلى توفير استجابة موحّدة تربط بين مصادر معرفية متنوّعة ضمن سياق واحد.
وفي السياق، رأت د. نانسي بدران، مهندسة حلول الحوسبة للمشاريع السحابية في الحكومة الفيدرالية – أوتاوا، كندا، في حديثها لـ"النهار"، أن التوجّه الحالي يوضّح انتقالاً نحو نماذج تعمل كوكلاء أذكياء، قائلة:
“لم تعد المسألة تتعلق بمن يكتب نصاً أفضل، بل بمن يستطيع فهم سياق معقد واتخاذ قرارات وتنفيذ مهمة كاملة. فالمنافسة الحقيقية باتت تدور حول نماذج قادرة على الربط بين البيانات المتعددة ومتابعة المهام باعتمادية أعلى، مع تكييف أسلوبها حسب طبيعة المجال أو المشكلة المطروحة، وهو ما يعكس انتقالاً جوهرياً في دور الذكاء الاصطناعي داخل المؤسسات الحديثة. وهذا ما يمنح Gemini 3 موقعاً تنافسياً قوياً".
القدرات الوكيلية وتطبيقاتها التقنية
بحسب الوثائق التقنية الصادرة عن "غوغل"، يمتلك Gemini 3 خصائص محسّنة لدعم المهام الوكيلية (agentic capabilities)، بما في ذلك القدرة على تحليل مهام طويلة الأمد، تقسيمها إلى خطوات متتابعة، والحفاظ على سياق القرار عبر مراحل متعددة. وتُظهر الأمثلة المنشورة من الشركة قدرة النموذج على العمل ضمن بيئات محاكاة مخصّصة لهذه الأغراض. وتدعم بيئة Antigravity — وهي منصّة تطوير تقدّمها "غوغل" — إمكانية توجيه النموذج للتفاعل مع أدوات برمجية فعليّة، مثل المتصفح وبيئات الأوامر ومحرّرات الشيفرة، بهدف تمكين الاستخدام العملي من قبل المطوّرين والمهنيين.

دمج النموذج ضمن منظومة "غوغل"
أوضحت "غوغل" أنّ إحدى نقاط القوة الأساسية تكمن في دمج Gemini 3 في منظومتها منذ إطلاقه. ويتضمّن ذلك توفر النموذج عبر تطبيق Gemini، وعبر Google Search من خلال وضع AI Mode المتاح لشرائح من المستخدمين، إضافة إلى توفره في Google AI Studio وVertex AI لتطوير التطبيقات واختبار النماذج. ويسمح هذا الدمج المباشر بإمكان استخدام النموذج عبر أنماط عملية مختلفة — بدءاً من الاستخدام الفردي وانتهاءً بالتطبيقات المهنية — وفق البنية التي تعرضها Google في أدوات المطورين الخاصة بها.
موقع Gemini 3 في المشهد التنافسي
في سياق المنافسة مع نماذج مثل "شات جي بي تي" و"وكلود" و"ديبسبك"، يشير ما نشرته "غوغل" وتقارير تقنية مستقلة إلى أنّ Gemini 3 يجمع بين تعدد الوسائط وقدرات السياق الطويل (long-context processing) وخصائص الذكاء الوكيلي. ويهدف هذا المزيج إلى توسيع مجالات الاستخدام المتقدمة للذكاء الاصطناعي، خصوصاً في المهام التي تتطلب تحليلاً متعدد الطبقات أو تفاعلاً مع بيانات متنوعة. ومع تزايد الاعتماد على نماذج يمكنها الفهم والتنفيذ معاً، يندرج Gemini 3 ضمن التوجه الذي تسعى الشركات الكبرى لتطويره في إطار الجيل الجديد من نماذج الذكاء الاصطناعي.
نبض