Украинский стартап тренирует нейросеть распознавать крымскотатарский язык. Для этого собирают голоса тысячи крымчан

Украинский стартап Respeecher, занимающийся синтезированием голосов в Голливуде, тренирует бесплатную нейросеть для распознавания крымскотатарского языка и для этого собирает 1000 голосов крымчан.

Об этом нам сообщили авторы стартапа.

Там указывается, что проект будет способствовать популяризации крымскотатарского языка и может ускорить его появление во многих привычных сервисах: помощниках в телефонах, чат-ботах и автоматических переводчиках.

Для высококачественного анализа инициаторы проекта нуждаются в тысячах часов с записями крымскотатарского языка. Чем больше отличных акцентов и тональностей голосов искусственный интеллект проанализирует, тем точнее будет результат распознавания речи.

Инициаторы проекта призывают носителей крымскотатарского языка отправлять аудиозаписи речи или же ссылки на записи через эту форму.

Лучше всего для анализа подойдут аудиозаписи крымскотатарского языка, которые записаны в тихой комнате с минимальным количеством фоновых шумов (таких как голоса других людей, шум автомобилей, звук кондиционера или холодильника и т.д.).

Организаторы проекта указывают, что желательно делать записи на хороший микрофон, впрочем, даже аудиозаписи, сделанные на iPhone, или подкасты также подойдут.

«Процесс сбора и анализа информации достаточно затратный: может занять много месяцев... Впрочем, наша команда хочет, чтобы этот ресурс был бесплатным и доступным в открытых источниках», — отметил СЕО и соучредитель Respeecher Дмитрий Белевцов.

Команда стартапа заверила, что никакие данные конкретных людей не будут храниться. Без разрешения носителя языка команда никогда не будет воспроизводить и не будет синтезировать чужие голоса.

«Все отправленные данные будут использованы только в целях обучения нейросети и для анализа крымскотатарского языка в целом и его лучшего распознавания», — отметили там.

И добавили, что ранее стартап уже работал с крупнейшими голливудскими студиями, соблюдая эти этические стандарты сотрудничества.

Больше о стартапе

Respeecher — это украинский стартап, который с помощью искусственного интеллекта позволяет одному человеку разговаривать голосом другого. Продукт создан в 2018 году Александром Сердюком, Дмитрием Белевцовым и Грантом Рибером.

Команда Respeecher работала над созданием голосов для «Звездных войн», а именно: голосов Дарта Вейдера и Люка Скайвокера. В 2021 стартап был номинирован и выиграл Emmy Awards.

Команда Respeecher уже научила нейросеть распознавать украинский язык. Этим ресурсом могут воспользоваться как единичные разработчики и ученые, чтобы улучшить аудиовосприятие украинского языка в своем продукте, так и крупные корпорации, вроде Facebook, Google или помощники, как Siri.

Сейчас команда стартапа насчитывает около 45 человек и до сих пор расширяет команду. Главный офис Respeecher — в Киеве.