Microsoft представила новую нейросеть VASA-1, которая способна создавать говорящие что угодно дипфейки лишь по одному фото, пишет издание Creative Blog.
Теперь уже даже странно вспоминать времена, когда все, что мог делать ИИ, — это генерировать изображения из текстовой подсказки. За последние пару лет генеративный искусственный интеллект становился все более мощным, переходя от фотографий к видео с появлением таких инструментов, как Sora. И теперь Microsoft представила мощный инструмент, который, возможно, является самым впечатляющим (и устрашающим) из всех, что мы когда-либо видели.
Сообщается, что для генерирования видео говорящего человека с широким спектром эмоций и естественной мимикой достаточно предоставить новой нейросети одно изображение человека и аудиодорожку.
«Благодаря обширным экспериментам, включая оценку набора новых показателей, мы показали, что наш метод значительно превосходит предыдущие методы по различным параметрам. Наш метод не только обеспечивает высокое качество видео с реалистичной мимикой и движениями головы, но также поддерживает онлайн-генерацию видео 512×512 со скоростью до 40 кадров в секунду с незначительной начальной задержкой. Это открывает путь к взаимодействию в реальном времени с реалистичными аватарами, имитирующими поведение человека в ходе разговора», — приводит издание сообщения Microsoft.
Огромные возможности открывает ИИ и в финансовой сфере. Высокие технологии для вашей доходности — в сервисе «Финам AI-скринер». Данный сервис поможет собрать инвестиционный портфель, узнать прогноз по акциям и рейтинг ожидаемых дивидендных выплат, а также многое другое.
*Сообщение носит информационный характер, не является индивидуальной инвестиционной рекомендацией или предложением приобрести упомянутые ценные бумаги. Приобретение иностранных ценных бумаг связано с дополнительными рисками.
Больше на Онлайн журнал sololaki
Subscribe to get the latest posts sent to your email.