VASA-1: تقنية جديدة من مايكروسوفت تحول الصور إلى وجوه ناطقة

كشفت شركة مايكروسوفت ريسيرش آسيا عن أداة ذكاء اصطناعي تجريبية جديدة تحمل اسم «VASA-1»، قادرة على تحويل صورة ثابتة لشخص، أو رسم له، إلى وجه ناطق حيوي بصورة واقعية وذلك بالاقتران مع ملف صوتي موجود.

تمتاز هذه التقنية بقدرتها على إنتاج تعابير الوجه وحركات الرأس بشكل متناسق مع الحركات الشفهية التي تتطابق مع الكلام أو الأغاني في الوقت الفعلي.

على الرغم من أن الحركات الشفهية والرأسية في النماذج المقدمة قد تبدو آلية بعض الشيء وغير متزامنة بشكل دقيق، إلا أنه من الواضح أن هذه التقنية قد تُستخدم بطرق غير ملائمة، كإنشاء مقاطع فيديو التزييف العميق (DeepFake) لأشخاص حقيقيين بسرعة وسهولة.

تدرك الفرق البحثية هذا الاحتمال وقررت عدم إطلاق «نموذج تجريبي عبر الإنترنت أو واجهة برمجة التطبيقات أو أي منتجات أو تفاصيل تنفيذ إضافية أو أي عروض ذات صلة» حتى يتأكدوا من أن تقنيتهم «سوف تُستخدم بمسؤولية ووفقًا للتنظيمات الصحيحة».

رغم هذه المخاوف، يعتقد الباحثون أن تقنية «VASA-1» تقدم فوائد عديدة، حيث أشاروا إلى إمكانية استخدامها في تحسين التكافؤ التعليمي وزيادة إمكانية الوصول للأشخاص الذين يواجهون تحديات في التواصل، من خلال توفير أفاتار يمكنه التواصل نيابة عنهم. كما يمكن أن توفر الرفقة والدعم العلاجي للأشخاص الذين يحتاجون إليها.

ذو صلة | تقنية التزييف العميق تُستخدم في عملية احتيال ضخمة في هونغ كونغ

تم تدريب الأداة على مجموعة بيانات VoxCeleb2، التي تحتوي على أكثر من مليون كلمة منطوقة لـ 6,112 من المشاهير تم استخراجها من مقاطع فيديو على يوتيوب، وتعمل الأداة أيضًا على الصور الفنية مثل صورة الموناليزا، التي جُمعت بطريقة فكاهية مع ملف صوتي للممثلة آن هاثاواي وهي تؤدي أغنية «باباراتزي» في مقطع مثير يستحق المشاهدة!

المصدر

التدوينة VASA-1: تقنية جديدة من مايكروسوفت تحول الصور إلى وجوه ناطقة ظهرت أولاً على عالم التقنية.



source https://www.tech-wd.com/wd/2024/04/22/vasa-1-%d8%aa%d9%82%d9%86%d9%8a%d8%a9-%d8%ac%d8%af%d9%8a%d8%af%d8%a9-%d9%85%d9%86-%d9%85%d8%a7%d9%8a%d9%83%d8%b1%d9%88%d8%b3%d9%88%d9%81%d8%aa/

تعليقات

المشاركات الشائعة من هذه المدونة

استعراض للحاسوب ASUS ROG Zephyrus G16: معالج AMD RYZEN 9 AI وكرت RTX 4070

حساب Evan Blass ينشر صور شبه مؤكدة لهاتف Find N5 المرتقب

إطلاق Realme GT 7 Pro Racing Edition في 13 فبراير كأرخص هاتف بمعالج Snapdragon 8 Gen 3 Elite

نيوم وداتاڤولت تطلقان مشروعًا للذكاء الاصطناعي المستدام باستثمارات 5 مليارات دولار

مراجعة لسماعة الأذن Samsung Galaxy Buds 3 Pro: الصوت حكاية !

HONOR Magic7 RSR: النسخة الفاخرة جدًا من Magic7 Pro! فتح الصندوق وتجربة أجمل لون!

إيلون ماسك يحاول الاستحواذ على OpenAI

تسريب جديد يكشف Samsung Galaxy A56 بألوان متعددة وتصميم واضح من زوايا مختلفة

Samsung Galaxy S25 Edge يظهر على Geekbench بمواصفات واعدة

ASUS Zenbook Duo: ثورة ابتكار الشاشة المزدوجة لعام 2025