شرکت تحقیقاتی مایکروسافت آسیا یک مدل هوش مصنوعی ارائه کرده است که میتواند ویدئوهای واقعی از یک تصویر ثابت و یک آهنگ صوتی تولید کند. VASA-1متعلق به مایکروسافت، جهش بزرگ دیگری در زمینه هوش مصنوعی به نظر میرسد. پس از آموزش مدل روی فیلمی از حدود 6هزار چهره واقعی در حال صحبت از مجموعه داده VoxCeleb2 این فناوری قادر به تولید ویدئوی واقعی ترسناک است که در آن سوژه جدید متحرک نهتنها قادر به همگامسازی دقیق لب با یک آهنگ صوتی ارائه شده است، بلکه حالات مختلف صورت و حرکات طبیعی سر نیز منطبق بر واقعیت است. شاید این مدل، شباهت زیادی به هوش مصنوعی Audio2Video از مؤسسه رایانههای هوشمند علیبابا باشد که چند ماه پیش ظاهر شد، اما مدل مایکروسافت واقعیتر و دقیقتر است. طبق گزارشها، VASA-1 قادر به تولید ویدئوهای همگامسازیشده با رزولوشن 512x512 پیکسل با سرعت 40فریم در ثانیه، با تأخیر بسیار کم است.
هوش مصنوعی ترسناک مایکروسافت
در همینه زمینه :