Mews وهمية:تم تدريب التعلم الآلي لتحويل الكلاب إلى قطط والعكس صحيح

لقد أصبحنا بارعين بشكل متزايد في تدريب أجهزة الكمبيوتر على التلاعب بالصور ومقاطع الفيديو ، ووضع كلمات مستشاري ترامب في أفواه المطربين الفرنسيين وتحويل مشاهد الشاطئ إلى تقديس إباحي. لذلك كانت مسألة وقت فقط قبل أن يتم تشغيل هذه التكنولوجيا المفضلة على الإنترنت ، القط.

مشروع من Nvidia و Cornell University هو الخطوة التالية في "ترجمة" الصور بدقة ، وقد تم توضيح ذلك من خلال التلاعب بفيديو لكلب لتحويله إلى قطة. ليس فقط قطة واحدة ، عقل ، ولكن أربعة سلالات مختلفة من القطط - كل منها يحرك رأسه بنفس طريقة الهاسكي الأصلي.

اقرأ التالي:الذكاء الاصطناعي مقابل التعلم الآلي

يُطلق على هذه التقنية اسم إطار عمل ترجمة صورة إلى صورة متعدد الوسائط غير خاضع للإشراف (MUNIT) من قبل منشئيها ويتم الترويج لها كتحسين على الأساليب السابقة من حيث أنها تمنح مزيدًا من الحرية لصورة معينة ليتم معالجتها في مجموعة من المخرجات المختلفة. كما يظهر مقطع فيديو لإطار العمل في العمل ، يمكن "ترجمة" قطة إلى عدد من الكلاب المختلفة ، والعكس صحيح.

يشير Xun Huang ، المؤلف الرئيسي لدراسة حول باحث وطالب دكتوراه في جامعة كورنيل ، يقول لـ ألفر .

"إطار عملنا غير خاضع للإشراف ، مما يعني أنه لا يحتاج إلى مشاهدة أمثلة للصور المقابلة (على سبيل المثال ، هذا يجب أن يتحول القط إلى ذلك كلب) ، ولكن يمكنه اكتشاف العلاقة من تلقاء نفسه. كما أنه متعدد الوسائط ، مما يعني أنه يمكن تحويل قطة واحدة إلى كلاب متعددة ، في حين أن الأعمال السابقة تدعم فقط التعيين الفردي ".

لا يهتم الباحثون فقط بتبديل أجسام المسكن. لقد استخدموا أيضًا إطار عمل MUNIT للتلاعب بصور المناظر الطبيعية في المواسم المختلفة ، وصور الأحذية وحقائب اليد من الرسومات المرسومة ، ومشاهد الشوارع من سيناريوهات القيادة التي تم إنشاؤها بواسطة الكمبيوتر.

يقول هوانغ:"توفر هذه التقنية مزيدًا من الحرية في معالجة الصور". "في السابق كانت عملية المعالجة حتمية - تحصل على صورة إخراج واحدة من المدخلات الخاصة بك. باستخدام طريقتنا ، يمكنك اختيار الإخراج الذي تريده من توزيع المخرجات المحتملة. يمكنك أيضًا التحكم في نمط الإخراج من خلال توفير مثال للصورة.

"من الناحية العملية ، يمكن استخدام هذه التقنية للمساعدة في عملية التصميم ، ولصنع ألعاب / أفلام ، وللمساعدة في تطوير سيارات ذاتية القيادة."

يشير المظهر الخارق للقطط "المترجمة" ، "Men-in-Black" ، إلى أن إطار العمل يمكن أن يفعل مع بعض التنقية. ومع ذلك ، يوضح المشروع مدى تقدم معالجة الصور غير الخاضعة للرقابة. هل يقوض حقيقة ما نراه على شاشاتنا؟ ربما. في الوقت الحالي ، على الأقل ، يمكنك أن ترى كيف يبدو فيدو مثل جينجر توم.

رمز الدراسة متاح من GitHub هنا. وجدت عن طريق المعرفة الاصطناعية.