Український стартап тренує нейромережу розпізнавати кримськотатарську мову. Для цього збирають голоси тисячі кримців
Український стартап Respeecher, який синтезує голоси в Голлівуді, тренує безкоштовну нейромережу для розпізнавання кримськотатарської мови і для цього збирає 1000 голосів кримців.
Про це нам повідомили автори стартапу.
Там вказують, що проєкт сприятиме популяризації кримськотатарської мови та може прискорити її появу в багатьох звичних сервісах: помічниках у телефонах, чат-ботах та автоматичних перекладачах.
Для високоякісного аналізу ініціатори проєкту потребують тисячі годин із записами кримськотатарської мови. Що більше відмінних акцентів і тональностей голосів штучний інтелект проаналізує, то точнішим буде результат розпізнавання мови.
Ініціатори проєкту закликають носіїв кримськотатарської мови надсилати аудіозаписи мовлення або ж посилання на записи через цю форму.
Найкраще для аналізу підійдуть аудіозаписи кримськотатарської мови, які зроблені в тихій кімнаті з мінімально можливою кількістю фонових шумів (таких як голоси інших людей, шум автомобілів, звук кондиціонера чи холодильника тощо).
Організатори проєкту вказують, що бажано робити записи на хороший мікрофон, втім навіть аудіозаписи, зроблені на iPhone, чи подкасти також підійдуть.
«Процес збору та аналізу інформації є доволі часозатратний: може зайняти багато місяців... Втім, наша команда хоче, щоб цей ресурс був безкоштовним і доступним у відкритих джерелах», — зазначив СЕО та співзасновник Respeecher Дмитро Бєлєвцов.
Команда стартапу запевнила, що жодні дані конкретних людей не будуть зберігатись. Без дозволу носія мови команда ніколи не відтворюватиме і не синтезуватиме чужі голоси.
«Усі надіслані дані будуть використані лише в цілях навчання нейромережі та для аналізу кримськотатарської мови в цілому та її кращого розпізнавання», — наголосили там.
І додали, що раніше стартап уже працював із найбільшими голлівудськими студіями, дотримуючись цих етичних стандартів співпраці.
Більше про стартап
Respeecher — це український стартап, який за допомогою штучного інтелекту дозволяє одній людині розмовляти голосом іншої. Продукт створений у 2018 році Олександром Сердюком, Дмитром Бєлєвцовим і Грантом Рібером.
Команда Respeecher працювала над створенням голосів для «Зоряних воєн», а саме: голосів Дарта Вейдера та Люка Скайвокера. У 2021 році стартап був номінований і виграв Emmy Awards.
Команда Respeecher уже навчила нейромережу розпізнавати українську мову. Цим ресурсом можуть скористатися як поодинокі розробники й науковці, щоб покращити аудіосприйняття української мови у своєму продукті, так і великі корпорації, на кшталт Facebook, Google, чи помічники, як-от Siri.
Наразі команда стартапу налічує приблизно 45 людей і досі розширюється. Головний офіс Respeecher — у Києві.