Нейросеть научили самостоятельно озвучивать панорамные фотографии.

Так, алгоритм сам добавляет реалистичные звуки окружения и конкретных объектов, которые находит на изображении и расставляет их в зависимости от расположения на снимке.

Технология может понадобится для разработчиков виртуальной реальности. Благодаря новой технологии создателям VR-игр и фильмов скоро придется озвучивать их вручную.

Напомним, группа разработчиков из Лаборатории исследований в области искусственного интеллекта Калифорнийского университета в Беркли и Университета Британской Колумбии представила алгоритм DeepMimic, что позволяет обучать нейросетевых виртуальных персонажей сложным движениям, совершаемыми людьми при помощи видео с YouTube.

Поделиться: