Перекладач Google навчився імітувати голос користувача

Наука і техніка

Google інтенсивно працює над голосовими помічниками і сервісами перекладу мови «на льоту» — це взаємозалежні продукти, перспективи яких незаперечні. У своєму блозі, присвяченому розробок штучного інтелекту, компанія поділилася новітньою технологією: переклад промови в промову із збереженням голосу мовця.

У 2018 з’явилися перші демонстрації роботи нового проекту Duplex. Це розширення асистента Google могло здійснювати дзвінки самостійно і голосом бронювати столик в ресторані, номер у готелі або замовляти квитки. Компанія змогла добитися такого звучання комп’ютерного голосу, що у співрозмовників не виникало дискомфорту і спілкування відбувалося природно. У деяких випадках люди не одразу розуміли, що говорять з програмою.

Переводчик Google научился имитировать голос пользователя

Google AI — науково дослідницький підрозділ компанії, що спеціалізується на технологіях штучного інтелекту. В першу чергу воно відомо створенням потужної загальнодоступній нейромережевої бібліотеки TensorFlow.

У середу, 15 травня в блозі Google AI з’явилася стаття з описом нової програми Translatotron та демонстрацією її роботи (кілька десятків звукозаписів для порівняння розміщені за посиланням). За допомогою нейромережевих алгоритмів штучного інтелекту система вимовляє перекладену мова на цільовому мовою тим же голосом, яким був здійснений введення вихідного звукового фрагмента. Іншими словами, користувач просто говорить, а голосової асистент переводить його мова на потрібну мову зі збереженням інтонації, тембру і висоти голосу.

Читайте также:
Атлантиці загрожує екологічна катастрофа - вчені

Це новий крок в мовних перекладачах, але невідомо, в якому вигляді ця технологія буде впроваджуватися в продукти Google. Існуючі алгоритми перекладу мови в мову складаються з трьох етапів: розпізнавання мовлення, переказ тексту та його озвучення. Translatotron працює за зовсім іншим принципом — «послідовність–послідовність», в якому програма діє також, як наш мозок, переводячи промову на льоту.

Сервіс Google Translate практично повністю витіснив всіх конкурентів з ринку мобільних і онлайн-перекладачів, проте компанія не зупиняється і додає до неї нові можливості. Зараз як додаток для смартфонів, так і веб-сервіс вміють не тільки переводити будь-які обсяги тексту, але й розпізнавати слова на зображеннях, а також у звукових файлах. Остання функція особливо зручна, якщо користувач не знайомий з писемністю іншої мови і змушений намагатися зрозуміти іноземця «на слух».

Source
Оцініть статтю
Популярний портал | Proexpress.com.ua | все найцікавіше в Україні

Thanks!

Our editors are notified.