Новый вариант речевой ИИ-модели Google USM позволит обрабатывать более 1000 языков

8 марта 2023

В разработке у Google находятся практически все виды ИИ-технологий, но Универсальная речевая модель (Universal Speech Model или USM) занимает в портфолио компании особое место. Этот проект стал частью попытки компании построить систему, способную понимать 1000 наиболее распространённых языков мира.

Источник изображения: intographics/unsplash.com

Источник изображения: intographics/unsplash.com

Хотя Google и Microsoft активно соперничают, пытаясь доказать превосходство своих чат-ботов, технология «человекоподобных» ИИ-инструментов — не единственная сфера применения машинного обучения и языковых моделей.

Наряду со слухами о планах представить более 20 инструментов на базе алгоритмов ИИ в ходе конференции I/O этого года, Google продолжает работать над языковой моделью, поддерживающей 1000 языков. В понедельник компания поделилась новой информацией о своей универсальной речевой модели, которую в Google описывают как «критический первый шаг» в реализации своих планов на этом поприще.

Ещё в прошлом ноябре компания анонсировала планы создания языковой модели, поддерживающей 1000 наиболее распространённых языков, рассказав об USM. Google описывает её как «семейство ультрасовременных речевых моделей» с 2 млрд параметров. При тренировке использовались 12 млн часов речи и 28 млрд предложений из более чем 300 языков.

USM уже используется Google для создания субтитров на YouTube, модель уже поддерживает автоматическое распознавание речи. Это позволяет автоматически определять и распознавать различные языки, от распространённых вроде английского или мандаринского диалекта китайского до амхарского или ассамского. По данным Google, уже сейчас USM поддерживает более 100 языков и послужит основой для строительства ещё более масштабной системы. Известно, что над аналогичной технологией ИИ-перевода уже работает Meta. Подробнее об USM можно почитать в докладе Google.

Одной из сфер применения технологии может быть использование в очках дополненной реальности — подобный концепт-вариант Google продемонстрировала ещё в ходе конференции I/O прошлого года. Система может в режиме реального времени переводить чужую речь, выводя результаты непосредственно на дисплей AR-очков. Впрочем, до появления окончательной версии технологии пока довольно далеко и Google придётся немало поработать, чтобы избежать досадных ошибок.

3dnews

Хочешь узнать больше - читай отзывы

← Вернуться на предыдущую страницу

Читайте также:

Верховного лідера Ірану сховали після ліквідації лідера Хезболли - ЗМІ 29 сентября 2024

Іран намагається визначитися з наступним кроком після того, як Ізраїль оголосив про знищення Хасана Насралли, стверджують джерела.

Бріжіт Бардо – 90 років: який вигляд у молодості мала секс-символ ХХ століття 29 сентября 2024

Бріжіт Бардо – 90 років: який вигляд у молодості мала секс-символ ХХ століття. Найвідвертіші фото Протягом своєї кар'єри зірка досягла шаленого успіху

Родина Бекхемів підтримала Вікторію на її модному показі. Фото 29 сентября 2024

Британська дизайнерка Вікторія Бекхем представила свою нову колекцію весна-літо 2025 на Паризькому тижні моди. Підтримати її на показ прийшла вся родина та багато знаменитостей.

 

Вас могут заинтересовать эти отзывы

FitCurves 5.0
FitCurves

Отзывов: 1

FitCurves  
FitCurves

Отзывов: 1

FitCurves  
FitCurves

Отзывов: 1

Каталог отзывов





×

Выберите область поиска

  • Авто
  • Одяг / аксесуари
  • Роботодавці
  • Інше