• جمعه 14 اردیبهشت 1403
  • الْجُمْعَة 24 شوال 1445
  • 2024 May 03
سه شنبه 4 اردیبهشت 1403
کد مطلب : 223179
+
-

هوش مصنوعی ترسناک مایکروسافت

شرکت تحقیقاتی مایکروسافت آسیا یک مدل هوش مصنوعی ارائه کرده است که می‌تواند ویدئوهای واقعی از یک تصویر ثابت و یک آهنگ صوتی تولید کند. VASA-1متعلق به مایکروسافت، جهش بزرگ دیگری در زمینه هوش مصنوعی به ‌نظر می‌رسد. پس از آموزش مدل روی فیلمی از حدود 6هزار چهره واقعی در حال صحبت از مجموعه داده VoxCeleb2 این فناوری قادر به تولید ویدئوی واقعی ترسناک است که در آن سوژه جدید متحرک نه‌تنها قادر به همگام‌سازی‌ دقیق لب با یک آهنگ صوتی ارائه شده است، بلکه حالات مختلف صورت و حرکات طبیعی سر نیز منطبق بر واقعیت است. شاید این مدل، شباهت زیادی به هوش مصنوعی Audio2Video از مؤسسه رایانه‌های هوشمند علی‌بابا باشد که چند ‌ماه پیش ظاهر شد، اما مدل مایکروسافت واقعی‌تر و دقیق‌تر است. طبق گزارش‌ها، VASA-1 قادر به تولید ویدئوهای همگام‌سازی‌شده با رزولوشن 512x512 پیکسل با سرعت 40فریم در ثانیه، با تأخیر بسیار کم است.

این خبر را به اشتراک بگذارید