آخر تحديث: السبت | التاريخ: 2020/06/06

التزييف العميق: تقنية قوية لإنشاء فيديو أو محتوى صوتي حقيقي مزيف

التزييف العميق: تقنية قوية لإنشاء فيديو أو محتوى صوتي حقيقي مزيف

بطبيعة الحال، كان ذلك الشخص سلفادور دالي، الذي كان ينظر إلى الزائر ويتحدث عن فنه ومتحفه. عندما كانت الزائرة على وشك المغادرة، ظهر سلفادور دالي مرة أخرى لكي يسألها عما إذا كانت ترغب في التقاط صورة معه، ثم أخذ هاتفها المحمول والتقط صورة سيلفي معها. في الواقع، يتمثل الشيء الرائع في هذا اللقاء في وجود دالي في حد ذاته. والسؤال الذي يطرح نفسه عند هذا المستوى هو  كيف يمكن أن يتفاعل أحد أعلام المدرسة السريالية الكبرى مع أفراد من الجمهور على الرغم من وفاته، وحتى أنه يمكنه استخدام جهاز الهاتف الذي لم يكن موجودا عندما كان على قيد الحياة؟ مرحبًا بكم في عالم التزييف العميق، وهي تقنية مثيرة للقلق ذات قدرة عالية على الخداع، غير أنه لها بعض الاستخدامات الإيجابية غير متوقعة.

علاوة على ذلك، يعد التزييف العميق بمثابة تقنية جديدة قوية لإنشاء فيديو أو محتوى صوتي حقيقي مزيف. لبعث الحياة في دالي، استخدم المتحف التعلم العميق لتمكين جهاز الكمبيوتر من عرض وجه ممثل حي، الذي كان يرتدي ملابس مشابهة لتلك التي يضعها دالي، ويتصرف مثله من خلال صورة تم إنشاؤها رقميًا لوجه الفنان وتعبيراته. ويتضمن ذلك “عملية تدريب” تقوم فيها خوارزميات التعلم الآلي المتقدمة بالتدقيق في التسجيلات الخاصة بدالي ليتعلم الممثل إنشاء صور وجه جديدة واقعية لكلا الرجلين. ويتعلم التقاط صورة حالية لأي من الرجلين وإنشاء صورة عن الآخر تتوافق تمامًا مع تعبيرات الوجه ووضعية رأس الأول.

يجعل هذا الأمر من الممكن إنشاء وجوه مختلفة لدالي التي تطابق مع حركات الممثل، والتي يتم إدراجها تلقائيًا في الفيديو الجديد، مما يخلق وهم دالي نفسه. هناك المزيد من التفاصيل لأولئك المهتمين بهذا الموضوع.

عندما تطرق الفرصة الباب

حتى اللحظة الراهنة، استغل معظم منتجي التزييف العميق الجانب المظلم لهذه التقنية. وتراوح استخدامها بين الأسلوب الساخر، بداية من مقطع الفيديو الذي نشر يوم كذبة نيسان/ أبريل الذي يظهر فيه مارك زوكربيرج يعلن أنه سيحذف فيسبوك  وصولا إلى اللقطات المدمرة لسمعة نجوم هوليود الذين يصورون وهم يضطلعون بأدوار بطولة في الأفلام الإباحية أو لأغراض احتيالية على غرار تقليد صوت الرئيس التنفيذي لطلب تحويل مبلغ كبير من المال.

على العموم يبدو أنه من غير الممكن إنكار المخاطر الناجمة عن التزييف العميق. ومع ذلك، يوضح مثال دالي أن شكوكا عديدة  تحوم حول هذه التكنولوجيا. وخلال البحث الذي أجريناه، قمنا بتصنيف تقنية التزييف العميق إلى خمس فئات وهي تبادل الصوت، وتحويل النص إلى كلام، وتبديل وجه إلى الفيديو، وفن تحريك الجسد الكامل للدمى بالتزامن مع تحريك الشفاه. في كل فئة، نرى فرص عمل واضحة ما زال بعضها لم يتحقق على أرض الواقع في حين أن البعض الآخر قيد الاستخدام في الوقت الراهن.

  1. التكلم البطني 2.0

تعمل تقنية تبديل الصوت على تغيير صوت شخص ما أو جعله يقلد صوت شخص آخر. يمكن التلاعب بالصوت لتبدو أصغر سنًا أو أكبر، أو أن يكون المتكلم رجلا أو امرأة،  يستخدم لهجات أو لكنات مختلفة. تشمل الاستخدامات المحتملة راوي كتاب صوتي يستخدم أصوات شخصيات مختلفة، أو يستخدم شخصًا مشهورًا ليكون راويًا دون الاضطرار إلى قراءة القصة بأكملها.

فضلا عن ذلك،  تفتح هذه التقنية المجال أمام إمكانيات مذهلة  للمساعدين الافتراضيين مثل سيري. وعوضا عن الاضطرار لتسجيل أصوات الممثلين الصوتيين بلهجات وأجناس مختلفة، يتيح التبادل الصوتي الفرصة القيام بذلك باستخدام صوت واحد فحسب، فهل سيظهر تطبيق هائل يستخدم هذه التكنولوجيا؟

  1. إعادة الأصوات

لسنوات عديدة، كان من الممكن جعل الكمبيوتر يتحدث عن طريق كتابة نص في تطبيق ما. في الوقت الحالي، أصبحت تقنية التزييف العميق متوفرة للقيام بذلك باستخدام صوت شخص معين حتى في حالة عدم تسجيل الكلمات المعنية من قبل. لقد ساهمت هذه التقنية في تغيير حياة الأشخاص الذين فقدوا القدرة على التحدث بشكل مفهوم، على غرار أولئك الذين أصيبوا بالسكتات الدماغية أو الذين يعانون من أمراض متصاعدة مثل التصلب الجانبي الضموري. ألق نظرة على مقطع الفيديو أدناه.

علاوة على ذلك، يمكن استعمال تكنولوجيا تحويل النص إلى كلام بهدف تصحيح الكلمات الخاطئة في التعليق الصوتي بدلاً من إعادة تسجيله مرة أخرى.

  1. “هل تتحدث معي؟”

مثلما سبق وأن شاهدنا في متحف دالي، يمكن أن تعمل تقنية تغيير الوجه في الفيديو على استبدال وجه شخص بوجه شخص آخر.  تنطوي هذه التقنية على إمكانات هائلة في الأفلام. على سبيل المثال، أوضح فنان محترف يستخدم تقنية التزييف العميق كيف كان من الممكن استخدام تقنيات مشابهة لتلك المستخدمة في متحف دالي لإزالة شيخوخة الممثل روبرت دي نيرو في فيلمه “الأيرلندي”، بدلاً من استخدام تطبيق الصور المنشأة بالحاسوب المكلف والذي استغرق وقتا طويلا، مما ساهم في ارتفاع التكلفة الإجمالية لإنتاج الفيلم لتصل إلى حدود 175 مليون دولار أمريكي، أي ما يعادل 135 مليون جنيه إسترليني. يوضح المقطع أدناه كيف يمكن لتقنية التزييف العميق تحقيق جودة مماثلة. تعتبر مضاعفة الحيل الواقعية استخداما آخر محتمل لهذه التقنية.

  1. بداية اللعبة

يمكن للدمى المتحركة كامل الجسم في مقطع الفيديو أن تنقل الحركة من جسم شخص إلى جسم شخص آخر. يمكن استخدام هذه التقنية في ألعاب فيديو لتكون أكثر شمولا، حيث يمكن للاعبين أن يقحموا أنفسهم في الحركات باستخدام خصائص المشية والحركة الخاصة بهم، بالإضافة إلى الأفلام حيث يمكن للممثلين غير القادرين على الرقص  الظهور وهم يرقصون باستخدام لقطات من الراقصين المحترفين.

  1. وداعا لترجمة الحوار 

يمكن أن يؤدي تغيير مزامنة الصوت والفيديو إلى تغيير حركات الفم والكلمات المنطوقة في الفيديو. سيكون من الممكن قريبًا إجراء ترجمة للأفلام والبرامج التلفزيونية ومقاطع الفيديو الأخرى تكون فعالة من حيث التكلفة والجودة. تعمل الخوارزمية المدربة على تقليد صوت الممثل الأصلي ولكن بلغة مختلفة، مع تزامن حركة الشفاه والكلمات الجديدة.

لذلك، في حين أنه من الواضح أن يمكن استخدام تقنية التزييف العميق بشكل ضار، وهو ما يحدث في الواقع، بيد أن تقنية التعليم العميق تفتح أيضًا المجال لظهور العديد من تطبيقات الأعمال المبتكرة. أصبحت العديد من الإمكانات الإبداعية والإنتاجية واضحة. ولا شك أن الأشخاص لم يتوصلوا إلى اكتشاف العديد من الاحتمالات الأخرى لم إلى حد الآن.

المصدر: ناشيونال إنترست

مقالات ذات صله