Новая нейросеть Google анимирует и озвучивает статичные картинки

Инженеры Google разработали новую нейросеть VLOGGER, способную из статической фотографии человека делать видео, на котором он что-то рассказывает. При этом используется ещё и запись речи, которая синхронизируется с говорящим персонажем в ролике.

Исходная картинка Результат генерации

«Наша цель — создать фотореалистичное видео переменной длины, изображающее речь целевого человека, включая его голову и жесты», — говорится на сайте проекта.

При генерации видео нейросеть учитывает предложенную аудиодорожку, чтобы создать подходящие движения тела, выражение лица, позу и даже соответствующим образом управлять взглядом. Более того, впоследствии можно даже редактировать выражение лица, как, например, открыть/закрыть глаза или рот.

Исходная картинка Результат генерации

Одной из сфер применения новой технологии может быть адаптация видео при переводе на другие языки. Нередко в фильмах и сериалах с переводом можно заметить, что речь не соответствует движению губ. VLOGGER позволяет это исправить.

Больше примеров видео и подробности работы нейросети доступны по ссылке.

Источник

Поделиться ссылкой:

Total Views: 62 ,

Пн	Вт	Ср	Чт	Пт	Сб	Вс
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Interesting

Новая нейросеть Google анимирует и озвучивает статичные картинки

Поделиться ссылкой:

Добавить комментарий Отменить ответ

Поиск

Свежее

Календарь

Посетители

Interesting

Поделиться ссылкой:

Добавить комментарий Отменить ответ

Поиск

Свежее

Метки

Календарь

Посетители