LG представила нейромережу Captioning AI, яка створює текстові описи для зображень

20 июня 2023

Одно из подразделений компании LG представило генеративную систему ИИ Captioning AI, которая в может распознавать элементы изображения и генерировать для них описания и ключевые слова — трудно переоценить пользу, которую подобная технология способна оказать, например, при систематизации баз фотоснимков крупных компаний.

Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Представители LG AI Research, занимавшейся разработкой Captioning AI, выступили на мероприятии Computer Vision and Pattern Recognition 2023, крупнейшей в мире конференции, посвящённой «компьютерному зрению» — она проходила в воскресенье в Ванкувере (Канада). Как сообщили в LG, сервис основан на разработанной LG AI Research технологии Zero-shot Image Captioning, позволяющей ИИ «понимать» и описывать объекты или сцены, которые нейросеть оценивает впервые без дополнительных подсказок, на основе своего предыдущего опыта — так же, как и люди.

В компании объяснили, что технология отличается от ИИ-сервисов вроде Midjourney, в которых всё происходит ровно наоборот — пользователи вводят текст или загружают картинку, на основе которых ИИ генерирует собственное творение. Создание «субтитров» к картинкам может показаться довольно лёгким, поскольку концепция не нова. Тем не менее, технология вышла на новый уровень. Например, искусственный интеллект действительно может делать выводы и описывать то, чего он не «видел» никогда раньше — посмотреть на пейзаж или человека и вычислить, о каком именно месте идёт речь. Технология позволяет распознавать на изображении фон, персонажей и даже активность и описывать взаимодействие элементов.

Источник изображения: LG

Источник изображения: LG

Captioning AI может генерировать текстовые описания и ключевые слова для 10 тыс. изображений менее чем за два дня, что в теории позволяет повысить эффективность и продуктивность для компаний, которым необходимо справляться с большими массивами изображений. В среднем система может генерировать 5 предложений и 10 ключевых слов за 10 секунд.

Сервис разработан при сотрудничестве с Shutterstock, одной из крупнейших платформ для размещения визуального контента — от изображений до видео. LG AI Research сотрудничала с этой американской компанией ранее и намерена делать это и впредь расширяя сотрудничество и с другими партнёрами. Как сообщили в Shutterstock, технология Caption AI развивается благодаря «раннему доступу» к программе десяти глобальных клиентов.

3dnews

Хочешь узнать больше - читай отзывы

← Вернуться на предыдущую страницу

Читайте также:

В Тасманії почали будувати «чорний ящик Землі» — надзахищений бункер з кліматичним архівом планети 20 июня 2026

Кліматичні зміни на Землі можуть мати тяжкі наслідки, тому вчені та інженери прагнуть максимально детально задокументувати відбуваються процеси. Ці дані можуть виявитися корисними майбутнім поколінням, дозволивши не лише відновити картину кліматичних змін, але й зрозуміти, які рішення до них призвели.

Найбільше з квітня: Ормузьку протоку перетнули 25 суден 20 июня 2026

Трафік в Ормузькій протоці зріс до 25 суден за добу після угоди Сполучених Штатів Америки та Ірану.

 

Вас могут заинтересовать эти отзывы

Морозов В. Ю. 5.0
Морозов В. Ю.

Отзывов: 1

квитки на концерт 5.0
квитки на концерт

Отзывов: 1

Каталог отзывов





×

Выберите область поиска

  • Авто
  • Одяг / аксесуари
  • Роботодавці
  • Інше