Британские ученые научили нейросеть превращать текст в видео с языком жестов
Британские ученые из Университета Суррея представили нейросеть, которая может превратить текст в видео с человеком, который будет показывать текст языком жестов.
Соответствующую статью опубликовали на ресурсе препринтов arXiv.
Так, разработчики создали алгоритм, который может переводить текст на язык жестов. В частности, нейросеть отдельно учится качественно вырисовывать кисти рук, потому что именно они важны для точно сурдоперевода.
Далее текст проходит через кодирование и превращается в скелетную модель тела, которая показывает текст жестами. После этого последовательность поз кодируется в вектор, а он объединяется с изображением человека, которого нужно анимировать. Тогда последовательность поз передается на нейросеть U-Net, которая превращает изменение поз в реалистичное видео.
Созданный британцами алгоритм также совершенствует свои навыки. Он анализирует, насколько удачно создал скелетную модель тела, и делает ее лучшей в следующий раз.
Работу нейросети проверили на записях работы переводчиков жестового немецкого языка. Оказалось, что алгоритм достиг значительного сходства с изображением жестов сурдопереводчиками, в частности он точно воспроизводил движения кистей.
- Поделиться: