Британские ученые научили нейросеть превращать текст в видео с языком жестов

Евгения Луценко

Редактор ленты новостей hromadske. Считаю, что уважение к каждому, критическое мышление и признание ошибок спасут мир. Особенно люблю новости о науке и космос

30 ноября 2020 14:19

Британские ученые из Университета Суррея представили нейросеть, которая может превратить текст в видео с человеком, который будет показывать текст языком жестов.

Соответствующую статью опубликовали на ресурсе препринтов arXiv.

Так, разработчики создали алгоритм, который может переводить текст на язык жестов. В частности, нейросеть отдельно учится качественно вырисовывать кисти рук, потому что именно они важны для точно сурдоперевода.

Далее текст проходит через кодирование и превращается в скелетную модель тела, которая показывает текст жестами. После этого последовательность поз кодируется в вектор, а он объединяется с изображением человека, которого нужно анимировать. Тогда последовательность поз передается на нейросеть U-Net, которая превращает изменение поз в реалистичное видео.

Созданный британцами алгоритм также совершенствует свои навыки. Он анализирует, насколько удачно создал скелетную модель тела, и делает ее лучшей в следующий раз.

Работу нейросети проверили на записях работы переводчиков жестового немецкого языка. Оказалось, что алгоритм достиг значительного сходства с изображением жестов сурдопереводчиками, в частности он точно воспроизводил движения кистей.