هجمات متعددة الأدوار تتغلب على دفاعات الذكاء الاصطناعي مفتوح الوزن

تكنولوجيا 11-11-2025 | 08:05

هجمات متعددة الأدوار تتغلب على دفاعات الذكاء الاصطناعي مفتوح الوزن

تقرير من Cisco AI Defense يكشف عن هشاشة النماذج اللغوية أمام هجمات حوارية متعدّدة الأدوار تتجاوز الدفاعات التقليدية.
هجمات متعددة الأدوار تتغلب على دفاعات الذكاء الاصطناعي مفتوح الوزن
صورة تعبيرية
Smaller Bigger

كشف تقرير صادر عن وحدة Cisco AI Defense، وهي الذراع البحثية والأمنية لشركة Cisco Systems الأميركية المتخصصة في أمن الذكاء الاصطناعي، عن أن النماذج اللغوية الكبيرة مفتوحة الوزن (LLMs) ما زالت عرضة بشدّة للهجمات التكيفيّة متعدّدة الأدوار، رغم نجاحها النسبي في صدّ الهجمات الأحادية.

 

وأوضح التقرير بأن أداء هذه النماذج يتدهور سريعاً عندما يستخدم المهاجمون أساليب تدرّجية عبر محادثات متتابعة، بعد تحليل أكثر من ألف أمر لكل نموذج. كذلك بيّن أن تقنيات مثل Crescendo و Role-Play  و Refusal Reframe مكّنت المهاجمين من تجاوز أنظمة الأمان وإنتاج مخرجات غير آمنة.

 

صورة تعبيرية مولّدة بالذكاء الاصطناعي
صورة تعبيرية مولّدة بالذكاء الاصطناعي

 

ورصدت الوحدة 499 محادثة محاكاة تراوحت ما بين خمس إلى عشر جولات، أظهرت أن المرشحات التقليدية تفشل في مواجهة التلاعب المتكرر، فيما حدّد التقرير 15 فئة تهديد فرعية من أصل 102 من أنواع التهديدات، كان أبرزها توليد الأكواد الخبيثة، واستخراج البيانات، وانتهاك الحدود الأخلاقية، مؤكداً أن بعض النماذج تعاني من نقاط ضعف معمارية تجعلها أكثر عرضة للاستغلال في الهجمات الحوارية الممتدة.

 

 

وأوصت Cisco AI Defense بتطبيق أوامر نظام صارمة تتماشى مع حالات الاستخدام المحددة، واستخدام حواجز حماية وقت التشغيل، لا تعتمد على نموذج بعينه، وتنفيذ اختبارات أمنية دورية داخل بيئات العمل الفعلية، إضافة إلى الحد من التكامل مع الخدمات الخارجية.

 

وحذّر التقرير من أن غياب حلول أمنية متقدمة — مثل الاختبار المتكرر والمراقبة المستمرة — قد يؤدي إلى تسرب بيانات أو تلاعب خبيث في بيئات التشغيل، مشدداً على أهمية تطوير حواجز حماية مستقلة واختبارات أمنية مستمرة لضمان سلامة النماذج الذكية أثناء التشغيل.

الأكثر قراءة

المشرق-العربي 12/11/2025 6:15:00 AM
قذائف المزّة والعمليتان اللتان لم يفصل بينهما شهر تحمل رسائل تحذيرية إلى الشرع وحكومته، والرسالة الأبرز مفادها أن القصر الرئاسي تحت مرمى الصواريخ.
المشرق-العربي 12/11/2025 2:25:00 AM
إنّها المرة الأولى التي تتهم المنظمة "حماس" وفصائل أخرى بارتكاب جرائم ضد الانسانية.
المشرق-العربي 12/11/2025 2:10:00 PM
شدد على ضرورة منح المحافظة حكماً ذاتياً داخلياً أو نوعاً من الإدارة الذاتية ضمن سوريا كوسيلة لحماية الأقليات وحقوقها.
اقتصاد وأعمال 12/11/2025 10:44:00 AM
تكمن أهمية هذا المشروع في أنه يحاول الموازنة بين 3 عوامل متناقضة: حاجات المودعين لاستعادة ودائعهم بالدولار الحقيقي، قدرة الدولة والمصارف على التمويل، وضبط الفجوة المالية الهائلة التي تستنزف الاقتصاد