13 сентября 2016
В настоящее время довольно просто понять, говорит ли реальный человек, или же речь идёт об искусственном преобразовании текста в речь. Но может пройти не так много времени, когда робот может заставить поверить в то, что разговор ведётся с настоящим человеком — всё благодаря новому искусственному интеллекту WaveNet, разработанному командой Google DeepMind.
DeepMind ранее уже не раз отличилась в создании успешных алгоритмов нейронных сетей — например, команда создала искусственный интеллект AlphaGo, который оказался весьма хорош при игре в го и обошёл одного из лучших игроков в эту настольную игру.

В настоящее время разработчики используют два основных метода для создания программ генерации человеческой речи. Один подразумевает использование огромной коллекции слов и фрагментов речи, произнесённых одним человеком, из-за чего сложно манипулировать со звуками и интонациями голоса. Другой формирует слова электронно, в зависимости от того, как они должны звучать — интонации здесь задавать проще, но результат звучит гораздо менее естественно.
Чтобы создать синтезатор, звучащий близко к человеческой речи, команда в качестве входящих данных передала нейронной сети аудиозаписи реальных людей. WaveNet обучается соответствию текста определённым формам колебаний волны и затем на основании этой базы знаний формирует из текстовых отрывков отдельные звуковые волны.
Участвовавшие в тестировании люди оценивали новый метод в сравнении с другими алгоритмами на слух. Предпочтение было отдано WaveNet — этот ИИ звучал наиболее «по-человечески» из всех представленных. DeepMind заявляет, что их метод сокращает дистанцию между самыми лучшими синтезаторами и настоящей человеческой речью более чем вдвое. В эксперименте участвовали тексты на английском и китайском. Команда, впрочем, отмечает, что пока WaveNet не может применяться в приложениях, зато можно ознакомиться с образцами синтезированной речи на сайте DeepMind.
Хочешь узнать больше - читай отзывы
← Вернуться на предыдущую страницу
Ввозили наркотики до України під виглядом оливкової олії: поліцейські Києва викрили двох "бізнесменів" 27 февраля 2026
Ввозили наркотики до України під виглядом оливкової олії: поліцейські Києва викрили двох "бізнесменів". Фото Підозрюваним загрожує до 12 років позбавлення волі з конфіскацією майна
У Європі готують запуск надшвидкого транспорту 27 февраля 2026
У Європі готують запуск надшвидкого транспорту
Samsung розчарувалася у сверхтонких смартфонах після провалу Galaxy S25 Edge — трьохскладного TriFold 2 також поки не буде 27 февраля 2026
Якщо Apple до ідеї випуску надтонкого смартфона iPhone Air дійшла лише восени минулого року, то Samsung Electronics свою надтонку модель Galaxy S25 Edge пропонує з травня минулого року. Накопивши статистику продажів, південнокорейський гігант приходить до висновку, що ще одна надтонка модель ринку зараз просто не потрібна.