انتشرت في الآونة الأخيرة ظاهرة "توليد الصور بالذكاء الاصطناعي"، وهي تتمّ من خلال كتابة بضع كلمات في نظام خاصّ بتوليد الصور، ليقوم بإنتاج صورة تطابق الوصف بالفعل. الصور ليست مثالية، غالباً ما تُظهر أشكالاً غير طبيعيّة أو غريبة بعض الشيء، فتواجه برامج إنتاج الصور مشكلات مع النص، وتنشئ علامات غير منطقية أو أبجدية خاصة بها.
لكن برامج توليد الصور هذه، التي تبدو مثل الألعاب اليوم، يمكن أن تكون بداية لموجة كبيرة في التكنولوجيا، يسميها التقنيون النماذج التوليدية أو الذكاء الاصطناعي التوليدي، بحسب "سي أن بي سي".

العام الماضي، أصبح الذكاء الاصطناعي التوليدي أفضل بكثير، لدرجة أنه ألهم الناس لترك وظائفهم وبدء شركات جديدة والحلم بمستقبل يمكن للذكاء الاصطناعي أن يدعم فيه جيلاً جديداً من عمالقة التكنولوجيا.
كان مجال الذكاء الاصطناعي يمرّ بمرحلة ازدهار على مدار نصف العقد الماضي، ولكن هذا التغيير كان مقتصراً على تحليل البيانات، فنمت نماذج الذكاء بسرعة كافية للتعرف على ما إذا كانت هناك قطة في الصورة التي التقطتها للتو على هاتفك، والتقنية موثوقة بما يكفي لتستخدمها "غوغل" في خدمة البحث العكسي عن الصور.
ولكن يمكن لنماذج الذكاء الاصطناعي الآن إنتاج صور جديدة تماماً لم تكن موجودة من قبل، بعبارة أخرى، إنها تنشئ ولا تحلّل فقط.
وقال بوريس دايما، مبتكر منصّة "Craiyon" للذكاء الاصطناعي التوليدي: "الجزء المثير للإعجاب، حتى بالنسبة لي، هو أن الذكاء قادر على تأليف أشياء جديدة. لا يقتصر الأمر على إنشاء صور قديمة فحسب، بل إنها أشياء جديدة يمكن أن تكون مختلفة تماماً عمّا شوهد من قبل".

وكتبت شركة "سيكويا كابيتال" - أنجح شركة رأس مال مغامر، والتي راهنت على نجاح شركات مثل "أبل" و"غوغل" - في منشور على موقعها على الإنترنت أنّ "الذكاء الاصطناعي العام لديه القدرة على توليد تريليونات من الدولارات من القيمة الاقتصادية. وتتوقّع أن الذكاء الاصطناعي التوليدي يمكن أن يغيّر كل القطاعات التي تتطلّب من البشر إنشاء عمل أصلي، من الألعاب إلى الإعلان إلى القانون.
أشارت "سيكويا" أيضاً إلى أن المنشور كُتب جزئياً بواسطة "GPT-3"، وهو ذكاء اصطناعي توليدي لإنتاج النصوص.
كيف يعمل الذّكاء الاصطناعي التّوليدي؟
يستخدم الذكاء الاصطناعي تقنيات من التعلم الآلي تسمّى التعلم العميق، والتي دفعت معظم التطورات في مجال الذكاء الاصطناعي منذ 2012. ويستخدم التعلّم العميق نماذج مدربة على مجموعات كبيرة من البيانات حتى يفهم البرنامج العلاقات في تلك البيانات، ثم يمكنه تطبيق المهام المطلوبة منه، مثل تحديد ما إذا كانت الصورة بها كلب، أو ترجمة نص.
وتعمل مولدات الصور عن طريق قلب هذه العملية؛ بدلاً من الترجمة من الإنكليزية إلى الفرنسية، على سبيل المثال، يقوم بترجمة عبارة إنكليزية إلى صورة، وعادةً ما تتكوّن من جزءين رئيسيين، أحدهما يحلّل العبارة الأولية، والثاني يحوّل تلك البيانات إلى صورة.
وكان "DALL-E" أوّل مولِّد للصور يحظى باهتمام كبير، وهو برنامج أُعلن عنه في عام 2021 من قِبل "OpenAI"، وهي شركة ناشئة مموّلة في وادي السيليكون. وأصدرت "OpenAI" نسخة أكثر قوة هذا العام.
بينما يُعدّ "Craiyon"، الذي كان يُعرف سابقاً باسم "Dall-E Mini"، منشئ صور شائع الاستخدام قائماً على الذكاء الاصطناعي، وهو متاح على الويب، ويمكن للمستخدمين كتابة عبارة ورؤيتها على هيئة صورة في دقائق.
أُطلقت المنصّة في تموز (يوليو) 2021، وتنتج الآن حوالي 10 ملايين صورة يومياً. وقال منشئ المنصّة دايما إنّه قد جعل "Craiyon" وظيفته بدوام كامل بعدما ارتفع الاستخدام في وقت سابق من هذا العام. ويقول إنه يركز على استخدام الإعلانات لإبقاء موقع الويب مجانياً للمستخدمين نظراً لارتفاع التكاليف.
لكن البرنامج الذي ألهم أكثر من غيره هو "Stable Diffusion"، والذي أُصدر للجمهور في آب (أغسطس)، إذ إنّ الكود الخاص به متاح على "GitHub" ويمكن تشغيله على أجهزة الكمبيوتر، ليس فقط في السحابة (كلاود) أو من خلال واجهة برمجة، وقد ألهم ذلك المستخدمين لتعديل رمز البرنامج لأغراضهم الخاصة.
على سبيل المثال، تم دمج "Stable Diffusion" في "فوتوشوب"، ما يسمح للمستخدمين بإنشاء خلفيات وأجزاء أخرى من الصور، ويمكنهم بعد ذلك معالجتها مباشرةً داخل التطبيق باستخدام أدوات "فوتوشوب" أخرى.
وقال مطور البرنامج الذي يتيح الدمج، كانتريل، والذي كان يعمل في "أدوبي" لمدّة 20 عاماً: "أردت أن أقابل محترفين مبدعين أينما كانوا، وأردت تمكينهم من إدخال الذكاء الاصطناعي في سير عملهم، وليس تفجير سير عملهم".
ولفت إلى أنّه ترك وظيفته هذا العام للتركيز على الذكاء الاصطناعي التوليدي. ويقول له الفنانون إنهم يستخدمون برنامجه بطرق لا تعد ولا تحصى لم يكن ليتوقعها.
يمكن للشّركات الناشئة ومقدّمي الخدمات السحابيّة وصانعي الرّقائق أن تزدهر
ينظر بعض المستثمرين إلى الذكاء الاصطناعي التوليدي باعتباره تحوّلاً محتملاً في القطاع التكنولوجي، مثل الهاتف الذكي أو الأيام الأولى للويب. وتعمل هذه الأنواع من التحولات على الانتقال من عدد قليل من المهووسين المتخصصين إلى متخصصين في مجال الأعمال، وفي النهاية أي شخص آخر.
وقال كانتريل: "التعلم الآلي يشبه نوعاً ما قواعد البيانات، حيث كانت قواعد البيانات بمثابة أمر ضخم لتطبيقات الويب. تقريباً كل تطبيق استخدمته أنت أو استخدمناه في حياتنا موجود في أعلى قاعدة بيانات. لا أحد يهتم بكيفية عمل قاعدة البيانات، فهم يعرفون فقط كيفية استخدامها".
ويعتقد آخرون في هذا المجال أن الشركات الناشئة الرائدة في هذه التقنيات اليوم يمكن أن تتحدى في النهاية عمالقة البرمجيات الذين يهيمنون حالياً على مجال الذكاء الاصطناعي، بما في ذلك "غوغل" و"فايسبوك" و"مايكروسوفت"، ما يمهّد الطريق للجيل المقبل من عمالقة التكنولوجيا.
يمكن لمزودي الخدمات السحابية مثل Amazon و Microsoft و Google الاستفادة أيضاً، لأن الذكاء الاصطناعي التوليدي يمكن أن يكون مكثفاً للغاية من الناحية الحسابية.
قضايا أخلاقيّة
سيتعين على كل شخص يطور ذكاءً اصطناعياً أن يتعامل مع بعض القضايا الأخلاقية التي تنشأ عن مولدات الصور. فهناك سؤال عن الوظائف مستقبلاً، فعلى الرغم من أن العديد من البرامج تتطلب معالج رسومات قوياً، إلا أن المحتوى الذي يتم إنشاؤه بواسطة الكمبيوتر سيظل أقل تكلفة بكثير من عمل الرسام المحترف، والذي يمكن أن يكلف مئات الدولارات في الساعة.
ويمكن أن يسبّب ذلك مشكلة للفنانين ومنتجي الفيديو وغيرهم من الأشخاص الذين تتمثل مهمتهم في إنشاء عمل إبداعي. على سبيل المثال: منذ فترة فازت صورة أنشأها الذكاء الاصطناعيّ بمسابقة للفن، الأمر الذي أثار جدلاً واسعاً حول شرعيّة هذا الفوز وإن كان فيه ظلم للفنّانين.

هناك أيضاً أسئلة معقّدة حول الأصالة والملكية
يتم تدريب الذكاء الاصطناعي التوليدي على كميات هائلة من الصور، ولا يزال النقاش يتمحور حول ما إذا كان منشئو الصور الأصلية لديهم أي مطالبات بحقوق الطباعة والنشر على الصور التي أُنشئت.
ويبدو أن بعض الصور التي أُنشئت بواسطة "Stable Diffusion" تحتوي على علامات لحماية حقوق الطباعة والنشر.
وفي الشهر الماضي، منعت "Getty Images" المستخدمين من تحميل صور الذكاء الاصطناعي في قاعدة بياناتها، لأنها كانت قلقة بشأن التحديات القانونية المتعلقة بحقوق النشر.
يتعين على المطورين أيضاً أن يتعاملوا مع احتمال أن النماذج المدربة على كميات كبيرة من البيانات قد تحتوي على تحيزات تتعلق بالجنس أو العرق أو الثقافة المدرجة في البيانات.
العلامات الدالة
الأكثر قراءة
اتّسمت الحلقة الثانية من مرحلة المواجهات بأجواء حماسية، مع استمرار النجوم المدرّبين رامي صبري وداليا مبارك والشامي في اختيار الأصوات المتأهلة إلى المرحلة المقبلة.
مشهد عكس الشغف اللبناني بالحياة والفن والموسيقى، والتقاطع الثقافي بين لبنان وإيطاليا.
نبض