Alibaba випустила ШІ-моделі, які можуть розпізнавати зображення та вести діалог

26 августа 2023

Китайський технологічний гігант Alibaba представив дві мовні моделі - Qwen Large Vision Language Model (Qwen-VL) і Qwen-VL-Chat - демонструють розширені можливості інтерпретації зображень та ведення діалогів природною мовою. Враховуючи зростаючий попит на доступ до передових ІІ-алгоритмів, поява мовних моделей Alibaba може виявитися досить своєчасною.

Источник изображения: maginative.com

Джерело зображення: maginative.com
Представлені мовні моделі не обмежуються розумінням текстових повідомлень. Qwen-VL здатний сприймати і розуміти зображення, текст і дотримуватися обмежень. Алгоритм може обробляти запити, пов'язані з різними зображеннями, та генерувати відповіді на них. Qwen-VL-Chat призначений для більш складної взаємодії. Наприклад, може порівнювати кілька зображень, відповідати на серії питань, писати історії з урахуванням наданих користувачем картинок. Наприклад, користувач може запитати ІІ про місцезнаходження лікарні по фото її вивіски та отримати точну відповідь на це питання.
Одна з переваг представлених мовних моделей полягає в тому, що вони працюють із високою точністю. За даними Alibaba, Qwen-VL значно перевершує існуючі схожі мовні моделі з відкритим вихідним кодом за декількома критеріями оцінки англійської мови. Алгоритм також підтримує нову функцію «спілкування з чергуванням кількох зображень», яка припускає, що користувач надасть ІІ кілька зображень, після чого ставитиме пов'язані з ними питання.
Використовуючи стандартні зразки, фахівці Alibaba оцінили можливості нових алгоритмів при виконанні різних завдань, починаючи від генерації коментарів до зображень та закінчуючи відповідями на запитання щодо завантажених знімків. Обидві моделі також тестувалися за розробленим в Alibaba еталоном, який ґрунтується на оцінці GPT-4 для визначення діалогових можливостей та відповідності людському сприйняттю. Зазначається, що Qwen-VL та Qwen-VL-Chat досягли найкращих результатів у різних категоріях.
Alibaba стала однією з перших китайських компаній, що представили конкурентоспроможну систему генеративного ІІ, що свідчить про швидкий прогрес досліджень у сфері нейромереж у Піднебесній. Випускаючи моделі з відкритим вихідним кодом, Alibaba гарантує, що дослідники, вчені та компанії по всьому світу зможуть використовувати їх для створення власних програм, не вдаючись до трудомісткого та дорогого процесу навчання нейромереж з нуля.
Джерело зображення: maginative.com
Представлені мовні моделі не обмежуються розумінням текстових повідомлень. Qwen-VL здатний сприймати і розуміти зображення, текст і дотримуватися обмежень. Алгоритм може обробляти запити, пов'язані з різними зображеннями, та генерувати відповіді на них. Qwen-VL-Chat призначений для більш складної взаємодії. Наприклад, може порівнювати кілька зображень, відповідати на серії питань, писати історії з урахуванням наданих користувачем картинок. Наприклад, користувач може запитати ІІ про місцезнаходження лікарні по фото її вивіски та отримати точну відповідь на це питання.
Одна з переваг представлених мовних моделей полягає в тому, що вони працюють із високою точністю. За даними Alibaba, Qwen-VL значно перевершує існуючі схожі мовні моделі з відкритим вихідним кодом за декількома критеріями оцінки англійської мови. Алгоритм також підтримує нову функцію «спілкування з чергуванням кількох зображень», яка припускає, що користувач надасть ІІ кілька зображень, після чого ставитиме пов'язані з ними питання.
Використовуючи стандартні зразки, фахівці Alibaba оцінили можливості нових алгоритмів при виконанні різних завдань, починаючи від генерації коментарів до зображень та закінчуючи відповідями на запитання щодо завантажених знімків. Обидві моделі також тестувалися за розробленим в Alibaba еталоном, який ґрунтується на оцінці GPT-4 для визначення діалогових можливостей та відповідності людському сприйняттю. Зазначається, що Qwen-VL та Qwen-VL-Chat досягли найкращих результатів у різних категоріях.

Alibaba стала однією з перших китайських компаній, що представили конкурентоспроможну систему генеративного ІІ, що свідчить про швидкий прогрес досліджень у сфері нейромереж у Піднебесній. Випускаючи моделі з відкритим вихідним кодом, Alibaba гарантує, що дослідники, вчені та компанії по всьому світу зможуть використовувати їх для створення власних програм, не вдаючись до трудомісткого та дорогого процесу навчання нейромереж з нуля.

 

← Вернуться на предыдущую страницу

Читайте также:

В Білорусь з України залетіло рекордне число "шахедів" - соцмережі 25 ноября 2024

Моніторинговий Telegram-канал Беларускі Гаюн зазначає, що один з 38 безпілотників білоруси збили.

У Вільнюсі літак DHL упав на житловий будинок 25 ноября 2024

Один з членів екіпажу, що складався з пілотів і працівників DHL, загинув, а троє інших - постраждали.

Хезболла вдарила ракетами по Тель-Авіву 25 ноября 2024

Ракетна атака на Тель-Авіву стала відповіддю на авіаудар по центру Бейрута, внаслідок якого загинуло щонайменше 29 людей.

 

Вас могут заинтересовать эти отзывы

Теплорадість 5.0
Теплорадість

Отзывов: 1

Каталог отзывов





×

Выберите область поиска

  • Авто
  • Одяг / аксесуари
  • Роботодавці
  • Інше