عکس های سخنگو با هوش مصنوعی مایکروسافت، فیلم
به گزارش وبلاگ ایران، این سیستم قادر به فراوری حالات چهره، حرکات لب کاملاً هماهنگ و حرکات طبیعی سر است.
به گزارش خبرگزاری وبلاگ ایران ، محققان مایکروسافت سیستم هوش مصنوعی جدیدی را با نام VASA توسعه داده اند که می تواند از یک تصویر یا فایل صوتی، چهره های متحرک واقعی ایجاد کند. VASA-1، به عنوان اولین مدل ساخته شده با این چارچوب، می تواند حالات چهره، حرکات لب کاملاً هماهنگ و حرکات طبیعی سر را ایجاد کند. این سیستم پتانسیل ایجاد تجربیات مجذوب نماینده و واقعی را در برنامه های مختلف به همراه دارد.
براساس گزارش دیجیاتو، براساس شرحات مایکروسافت، عملکرد VASA-1 فراتر از تطبیق حرکات لب با صدا است و می تواند طیف گسترده ای از احساسات، ظرافت های چهره و حرکات طبیعی سر را نیز به تصویر بکشد و چهره های ساخته شده را واقعی تر نشان دهد. علاوه براین، روی ویدیوی فراوریشده کنترل دارد؛ به این معنا که کاربران می توانند جهت نگاه کردن شخصیت، فاصله درک شده و حتی حالت احساسی آن ها را معین نمایند.
هوش مصنوعی ساخت چهره سخنگو مایکروسافت
در ویدیوی زیر نحوه ساخت چهره سخنگو از روی یک تصویر ساده را می توانید مشاهده کنید:
نکته قابل توجه دیگر اینکه هرچند VASA-1 با عکس های هنری، صدای آواز یا گفتار غیرانگلیسی آموزش ندیده است، اما همچنان می تواند با استفاده از این ورودی ها ویدیو فراوری کند.
مایکروسافت در ادامه شرح می دهد که این سیستم می تواند ویدیوهایی با وضوح بالا (512 در 512 پیکسل) و نرخ فریم بالا فراوری کند. در حالت آفلاین، VASA-1 ویدیوهایی با سرعت 45 فریم درثانیه فراوری می نماید و در حالت آنلاین این اندازه به 40 فریم درثانیه می رسد.
محققان مایکروسافت ضمن اشاره به پتانسیل سوءاستفاده از این سیستم هوش مصنوعی، کاربردهای مثبت VASA-1 را برجسته نموده اند. ازجمله این کاربردها به بهبود تجربیات آموزشی و یاری درزمینه ارتباطات اشاره شده است.
227227
منبع: خبرآنلاین