LG представила нейромережу Captioning AI, яка створює текстові описи для зображень

20 июня 2023

Одно из подразделений компании LG представило генеративную систему ИИ Captioning AI, которая в может распознавать элементы изображения и генерировать для них описания и ключевые слова — трудно переоценить пользу, которую подобная технология способна оказать, например, при систематизации баз фотоснимков крупных компаний.

Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Представители LG AI Research, занимавшейся разработкой Captioning AI, выступили на мероприятии Computer Vision and Pattern Recognition 2023, крупнейшей в мире конференции, посвящённой «компьютерному зрению» — она проходила в воскресенье в Ванкувере (Канада). Как сообщили в LG, сервис основан на разработанной LG AI Research технологии Zero-shot Image Captioning, позволяющей ИИ «понимать» и описывать объекты или сцены, которые нейросеть оценивает впервые без дополнительных подсказок, на основе своего предыдущего опыта — так же, как и люди.

В компании объяснили, что технология отличается от ИИ-сервисов вроде Midjourney, в которых всё происходит ровно наоборот — пользователи вводят текст или загружают картинку, на основе которых ИИ генерирует собственное творение. Создание «субтитров» к картинкам может показаться довольно лёгким, поскольку концепция не нова. Тем не менее, технология вышла на новый уровень. Например, искусственный интеллект действительно может делать выводы и описывать то, чего он не «видел» никогда раньше — посмотреть на пейзаж или человека и вычислить, о каком именно месте идёт речь. Технология позволяет распознавать на изображении фон, персонажей и даже активность и описывать взаимодействие элементов.

Источник изображения: LG

Источник изображения: LG

Captioning AI может генерировать текстовые описания и ключевые слова для 10 тыс. изображений менее чем за два дня, что в теории позволяет повысить эффективность и продуктивность для компаний, которым необходимо справляться с большими массивами изображений. В среднем система может генерировать 5 предложений и 10 ключевых слов за 10 секунд.

Сервис разработан при сотрудничестве с Shutterstock, одной из крупнейших платформ для размещения визуального контента — от изображений до видео. LG AI Research сотрудничала с этой американской компанией ранее и намерена делать это и впредь расширяя сотрудничество и с другими партнёрами. Как сообщили в Shutterstock, технология Caption AI развивается благодаря «раннему доступу» к программе десяти глобальных клиентов.

3dnews

Хочешь узнать больше - читай отзывы

← Вернуться на предыдущую страницу

Читайте также:

В Ірані стався землетрус поблизу ядерного об'єкта 24 марта 2025

Землетрус магнітудою 5,0 стався неподалік міста Ісфахан у центральній частині Ірану. Через кілька годин було зафіксовано другий поштовх магнітудою 4,5.

Кацурін показав, як приготувати вдома американський рецепт макаронів з сиром. Відео 23 марта 2025

Блогер та ресторатор Міша Кацурін традиційно поділився новим рецептом смачної страви на вихідний. Цього разу у своєму Instagram він показав, як приготувати макарони з сиром, а точніше американську "мак енд чіз".

Лопес готова знову закохатися: інсайдер розказав, яким має бути чоловік 23 марта 2025

Американська співачка Дженніфер Лопес, здається, не розчарувалася в чоловіках за майже рік після розлучення з актором Беном Аффлеком й готова знову закохатися.

 

Вас могут заинтересовать эти отзывы

WestLandTattooLviv 5.0
WestLandTattooLviv

Отзывов: 1

Каталог отзывов





×

Выберите область поиска

  • Авто
  • Одяг / аксесуари
  • Роботодавці
  • Інше