الذكاء الاصطناعي وتعريف آلة التعلم «1من 2»

أثبتت تقنية deepfakes للتلاعب بمقاطع الفيديو إتقان آلة التعلم والذكاء الاصطناعي فنون الوهم. فهل أصبحا مستعدين لمساعدة عملك على الابتكار؟ فقد احتلت ابتسامة الموناليزا فكر العلماء ورواد الفن لأجيال، واكتسب اللغز أخيرا بعدا جديدا بفضل الرسوم المتحركة الرقمية التي ابتكرها الباحثون في الذكاء الاصطناعي في شركة سامسونج.
وتمت مشاهدة مقطع الفيديو الذي عرضته "سامسونج" على يوتيوب ملايين المرات، ظهرت فيه الموناليزا بشكل واقعي تتحدث وتتحرك. لكن ذلك لم يكن بفضل رسومات حاسوبية هوليوودية لشخصيات ابتكرها الإنسان وتحكم فيها. بل تم ابتكارها 100 في المائة بواسطة الذكاء الاصطناعي، وعلى الأخص، شبكة عصبية مؤهلة من خلال بنك من الصور للتعرف على العلاقات بين معالم الوجه من خلال عديد من التعابير وتكرارها. حركات الوجه في الموناليزا مستمدة من مقاطع فيديو لثلاثة مواضيع إنسانية.
إن تعاون "سامسونج" مع ليوناردو دافنشي هو التعاون الأخير في سلسلة الأخبار الزائفة لتقنية deepfakes: وهي مقاطع فيديو مذهلة ولربما مخيفة، يتم خلالها التلاعب بوجوه شخصيات شهيرة بواسطة التكنولوجيا والقيام بشتى الأمور غير المتوقعة. تناول هذا الأسلوب حتى الآن باراك أوباما ساخرا من دونالد ترمب، والأسطورة سلفادور دالي (الذي مات في 1989) يلتقط صورة سلفي مع رواد المتحف، وغيرهم كثر. بالطبع تمتع مبتكرو deepfake وخوارزمياته برفاهية التغطية الكبيرة لمواضيعهم. فمن خلال تزييف الموناليزا، استطاعت "سامسونج" بث الحياة بصورة واحدة ثابتة، وصورة مرسومة. فهو نوع من التسلية ولكن قد تترتب عليه تداعيات خطيرة.
إن آلية عمل الكمبيوترات في المرحلة الأولية، التي تقدر وظائف المسارات في الصورة من المفروض أن تقوم بذلك عندما يتغير وجه الإنسان أو يتناوب على القيام بتعابير، ويتم تقدير تلك الوظائف بالاستناد إلى حركات وجه الإنسان. نجح الكمبيوتر في تعلم شكل وجه الإنسان وحركته، ومن ثم يقوم بنقل تلك المعرفة لأي صورة، كما حدث في الموناليزا. بذلك ينجح في توليد أرقام جديدة، مثل قيم البيكسل من 0 وحتى 255، التي تنتج عند تقديمها مقاطع الفيديو اe.
كما دهشنا عند رؤيتنا للموناليزا تتحدث، فإن الفكرة بمعنى أوسع، تشبه فكرة الحاسبة الرقمية التي ظهرت في أوائل الستينيات، فـ"السلائف الرقمية" موجودة منذ قرون. تستخدم الآلة الحاسبة مبادئ وضعها مطوروها وبيانات مدخلة يضعها المستخدم للحصول على نتيجة جديدة "على سبيل المثال الإجابة عن عملية حسابية". ذلك ما تقوم به بعض الخوارزميات أيضا: تستخدم المبادئ التي برمجها أحدهم لتوليد أرقام جديدة، وفي هذه الحالة تكون القيم الجديدة للبيكسل. مع ذلك يكمن الاختلاف الرئيس في كون آلة التعلم الإحصائية ترفع الاحتمالات من خلال تمكين الكمبيوتر من كتابة الرمز الخاص به – الذي قد يكون من مبادئه - وبشكل عام الدالة غير الخطية – التي تولد تلقائيا الأرقام وتنجز مهام مثل إنشاء مقاطع فيديو من صورة واحدة للموناليزا.
وهكذا تتم ترقية الكمبيوتر من مساعد يتبع مبادئ كتبها الإنسان إلى متدرب يقوم بتدريب نفسه على ترجمة النص أو التعرف على الأشياء داخل الصور أو ممارسة الألعاب، أو ابتكار حركات وجه واقعية بالاستناد إلى أنماط جمعها من الفيديو وصور ثابتة. لذا فإن تسمية Deepfake خاطئة. وبالمعنى الدقيق للكلمة، فإن المعلومات المرئية بتلك الفيديوهات ليست زائفة وبإمكاننا القول صورة "غير واضحة"، أو حتى توصية من "أمازون" و"نتفليكس"، أو نتاج أي من الخوارزميات الأخرى.
كانت أبحاث سابقة - كنت محظوظا لمشاركتي فيها - نوعا ما بمنزلة تمهيد لما حدث في deepfakes. ففي منتصف التسعينيات في معهد ماساتشوستس عندما كان التعلم الآلي الحديث في بداياته، اكتشف زميلي إمكانية استخدام مصفوفة الجبر لاستقراء الصور بأبعاد ثنائية وثلاثية من زوج من صورة ثابتة. كنا قادرين على جعل صورنا تتحرك وتتحدث كما هو الحال في deepfakes وإن لم تكن جودة الصورة عالية لخداع أي شخص.

الأكثر قراءة

المزيد من مقالات الرأي