ּּּИИ поможет Meta добиться реалистичного звука в виртуальных мирах

26 июня 2022

Компания Meta рассказала о работе над технологиями реалистичного звука для виртуальных миров — проект реализуется при содействии учёных Техасского университета в Остине. В рамках проекта были разработаны три модели искусственного интеллекта, доступные для сторонних разработчиков.

Источник изображения: Rodger Shija / pixabay.com

Источник изображения: Rodger Shija / pixabay.com

Как пояснила Кристен Гаруман (Kristen Garuman), профессор информатики Техасского университета и директор по исследованиям Meta AI, дополненную и виртуальную реальность нельзя сводить только к визуальной составляющей — важную роль в оживлении мира играет звук. На его качество влияют различные факторы: геометрия помещения, размещённые в нём объекты, а также расстояние до источника. Поэтому родилась идея использовать для обработки звука алгоритмы искусственного интеллекта.

Первый алгоритм получил название AviTAR — это «модель визуально-акустического согласования», которая обеспечивает преобразование звука в соответствии со средой. Чтобы объяснить работу алгоритма, авторы проекта привели пример. Мать посетила выступление своего ребёнка и при помощи очков дополненной реальности записала его прямо из зрительного зала. Алгоритм приводится в действие, когда женщина хочет воспроизвести запись дома. Система сканирует помещение, учитывая расположенные в нём предметы интерьера, и воспроизводит запись таким образом, как будто юный артист выступает в том же зале.

Второй алгоритм получил название Visually-Informed Dereverberation. Он предназначается для удаления из записи эффекта реверберации — множественных эхо, возникающих при отражении звука от стен и других объектов. Возвращаясь к примеру с детским концертом, мать при воспроизведении записи дома не услышит ничего, кроме музыки.

Наконец, третья модель ИИ получила название VisualVoice — она отделяет голос человека от остальных источников звука. Например, если записать видео, на котором спорят два человека, алгоритм выделит один из голосов, заглушив все остальные. Как пояснили в Meta, для этого искусственному интеллекту необходимы визуальные подсказки — он должен «видеть», кто говорит, и на основе этой информации различать в общем потоке необходимые нюансы.

3dnews

Хочешь узнать больше - читай отзывы

← Вернуться на предыдущую страницу

Читайте также:

Представлена складна миша Logitech Mobi Fold з сенсорною прокруткою та швидкою зарядкою 10 июня 2026

Logitech анонсувала складну мишу Mobi Fold, призначену для роботи в дорожніх умовах. Вона може похвалитися нековзним силіконовим покриттям, сенсорною панеллю замість коліщатка та ємним знімним акумулятором, який підтримує швидку зарядку.

Прем'єр Індії Моді встановив професійний рекорд 10 июня 2026

Нарендра Моді встановив рекорд тривалості перебування на посаді глави уряду Індії - 4399 днів.

Індія засумнівалася в безпеці Starlink і призупинила його запуск у країні 10 июня 2026

Супутникова мережа зв'язку Starlink має таке покриття та швидкість передачі інформації, що мало хто з тих, хто має доступ до неї в умовах військових конфліктів, може втриматися від спокуси використання цього сервісу поза межами мирних умов. Індія в цьому сенсі висловила занепокоєння щодо застосування технологій Starlink для ударів США по Ірану та призупинила погодження запуску сервісу на своїй території.

 

Вас могут заинтересовать эти отзывы

Фара Сервіс 5.0
Фара Сервіс

Отзывов: 1

Серж Н 0.5
Серж Н

Отзывов: 1

ineed.ua  
ineed.ua

Отзывов: 1

Каталог отзывов





×

Выберите область поиска

  • Авто
  • Одяг / аксесуари
  • Роботодавці
  • Інше