OpenAI представила нову технологію ШІ, яка відтворює голос. Але через реалістичність є безпекові ризики

Редакторка стрічки новин

30 березня 2024 02:20

Компанія OpenAI розповіла про тестування функції Voice Engine на основі штучного інтелекту, яка може відтворити людський голос. Проте поки що технології немає в публічному доступі через можливі ризики, зокрема, щодо створення дипфейків.

Про це пише Bloomberg.

OpenAI поділилася моделлю синтезу мовлення лише з 10 розробниками, оскільки відмовилася від ширшого представлення технології через відгуки від «зацікавлених сторін», зокрема політиків та експертів галузі.

«Ми розуміємо, що генерація мовлення, яке нагадує голоси людей, має серйозні ризики, які особливо важливі в рік виборів [у США]», — зазначили в компанії.

На відміну від попередніх зусиль OpenAI зі створення аудіовмісту, Voice Engine може створювати голос, який звучить як у конкретної людини разом із специфічним темпом та інтонаціями. Все, чого потребує програмне забезпечення — 15 секунд аудіозапису розмови людини, щоб відтворити її голос.

За словами журналістів Bloomberg, під час презентації інструменту вони переглянули кліп, у якому лунав голос гендиректора OpenAI Сема Альтмана. А втім, насправді ж це була промова повністю озвучена ШІ. У виданні кажуть, що її не можна було відрізнити від його справжнього мовлення.

Один із поточних партнерів OpenAI Інститут нейронаук Нормана Принса використовує цю технологію, щоб допомогти пацієнтам відновити свій голос. Так, інструмент зміг відновити голос молодої пацієнтки, яка втратила здатність чітко говорити через пухлину мозку. Для цього Voice Engine знадобилося відтворити її промову зі старого запису для шкільного проєкту.

Мовна модель OpenAI також може перекладати аудіо різними мовами. Платформа Spotify вже використовувала цю технологію у своїй пілотній програмі для перекладу подкастів.

Керівник проєкту Voice Engine Джефф Гарріс наголосив: «Очевидно, що здатність точно імітувати людську мову пов’язана з безпековою делікатністю». Тож у межах тестування компанія вимагає від своїх партнерів, зокрема, отримати згоду від мовця перед тим, як використовувати його голос, і повідомити слухачам, що вони чують голоси, створені ШІ.

Перш ніж ухвалити рішення про те, чи допускати цю функцію до ширшого використання, в OpenAI кажуть, що запитують відгуки зовнішніх експертів. Там пояснюють: «Важливо, щоб люди в усьому світі розуміли, куди рухається ця технологія, незалежно від того, чи будемо ми зрештою її широко розгортати чи ні».

Компанія сподівається, що це програмне забезпечення «мотивує необхідність посилити стійкість суспільства» проти викликів, спричинених більш просунутими технологіями ШІ. Наприклад, компанія закликала банки поступово відмовитися від голосової автентифікації для доступу до банківських рахунків і конфіденційних даних.