ИИ Google теперь читает по губам лучше, чем человек

28 ноября 2016

Исследователи из Google DeepMind и Оксфордского университета использовали искусственный интеллект для создания наиболее точного на сегодняшний день программного обеспечения для чтения по губам. Для тренировки нейронной сети учёные использовали тысячи часов записей с BBC, благодаря чему система научилась с вероятностью в 46,8 % определять то, что говорят люди на экране. Результаты могут показаться не такими уж и впечатляющими, особенно если учесть точность транскрибирования искусственным интеллектом аудиозаписей, однако профессионал в чтении по губам смог правильно определить слова в тех же видеороликах лишь в 12,4 % случаев.

Другая группа исследователей из Оксфордского университета ранее в этом месяце отчиталась о похожем проекте. Используя аналогичные технологии, они сумели создать программу LipNet, которая в тестах показала точность в 93,4 %, в то время как точность определения слов человеком составила 52,3 %. Однако программа эта тестировалась только на специально записанном для неё видео, в котором волонтёры зачитывали шаблонные фразы. В свою очередь, программное обеспечение DeepMind, называемое Watch, Listen, Attend, and Spell, транскрибировало естественные, неподготовленные диалоги из политических передач с канала BBC.

Для тренировки нейронной сети использовалось более пяти тысяч часов записей из таких телевизионных шоу, как Newsnight, Question Time и World Today. Ролики включали в себя 118 тысяч различных предложений и около 17,5 тысяч уникальных слов, в то время как в базе видеороликов для тестирования LipNet присутствовало всего 51 уникальное слово.

Исследователи из DeepMind считают, что их новая программа может быть полезна в целом ряде случаев — например, в помощи людям со слабым слухом в понимании диалогов. Она также могла бы быть использована для аннотирования немых фильмов или управления голосовыми помощниками посредством проговаривания слов на камеру.

3dnews

Хочешь узнать больше - читай отзывы

← Вернуться на предыдущую страницу

Читайте также:

Вагітна Вітвіцька похизувалася округлим животиком на тлі карпатських краєвидів 5 мая 2026

45-річна зірка, яка чекає на первістка, попозувала для атмосферних фото в Карпатах

Чи справді сніданок є найважливішим прийомом їжі 5 мая 2026

Твердження про те, що сніданок є найважливішим прийомом їжі, десятиліттями залишається одним із найпоширеніших у сфері здорового харчування. Його повторюють батьки, лікарі та навіть рекламні кампанії. Втім, сьогодні це правило вже не виглядає таким однозначним.

Штани-аладдіни: з чим носити головний тренд весни-літа 2026. Фото 5 мая 2026

Дізнайтеся з чим носити штани-балони, які в тренді весною-літом 2026. Від мандарин-жакету і футболок до мінімалістичних поєднань.

 

Вас могут заинтересовать эти отзывы

Каталог отзывов





×

Выберите область поиска

  • Авто
  • Одяг / аксесуари
  • Роботодавці
  • Інше