Alibaba випустила ШІ-моделі, які можуть розпізнавати зображення та вести діалог

26 августа 2023

Китайський технологічний гігант Alibaba представив дві мовні моделі - Qwen Large Vision Language Model (Qwen-VL) і Qwen-VL-Chat - демонструють розширені можливості інтерпретації зображень та ведення діалогів природною мовою. Враховуючи зростаючий попит на доступ до передових ІІ-алгоритмів, поява мовних моделей Alibaba може виявитися досить своєчасною.

Источник изображения: maginative.com

Джерело зображення: maginative.com
Представлені мовні моделі не обмежуються розумінням текстових повідомлень. Qwen-VL здатний сприймати і розуміти зображення, текст і дотримуватися обмежень. Алгоритм може обробляти запити, пов'язані з різними зображеннями, та генерувати відповіді на них. Qwen-VL-Chat призначений для більш складної взаємодії. Наприклад, може порівнювати кілька зображень, відповідати на серії питань, писати історії з урахуванням наданих користувачем картинок. Наприклад, користувач може запитати ІІ про місцезнаходження лікарні по фото її вивіски та отримати точну відповідь на це питання.
Одна з переваг представлених мовних моделей полягає в тому, що вони працюють із високою точністю. За даними Alibaba, Qwen-VL значно перевершує існуючі схожі мовні моделі з відкритим вихідним кодом за декількома критеріями оцінки англійської мови. Алгоритм також підтримує нову функцію «спілкування з чергуванням кількох зображень», яка припускає, що користувач надасть ІІ кілька зображень, після чого ставитиме пов'язані з ними питання.
Використовуючи стандартні зразки, фахівці Alibaba оцінили можливості нових алгоритмів при виконанні різних завдань, починаючи від генерації коментарів до зображень та закінчуючи відповідями на запитання щодо завантажених знімків. Обидві моделі також тестувалися за розробленим в Alibaba еталоном, який ґрунтується на оцінці GPT-4 для визначення діалогових можливостей та відповідності людському сприйняттю. Зазначається, що Qwen-VL та Qwen-VL-Chat досягли найкращих результатів у різних категоріях.
Alibaba стала однією з перших китайських компаній, що представили конкурентоспроможну систему генеративного ІІ, що свідчить про швидкий прогрес досліджень у сфері нейромереж у Піднебесній. Випускаючи моделі з відкритим вихідним кодом, Alibaba гарантує, що дослідники, вчені та компанії по всьому світу зможуть використовувати їх для створення власних програм, не вдаючись до трудомісткого та дорогого процесу навчання нейромереж з нуля.
Джерело зображення: maginative.com
Представлені мовні моделі не обмежуються розумінням текстових повідомлень. Qwen-VL здатний сприймати і розуміти зображення, текст і дотримуватися обмежень. Алгоритм може обробляти запити, пов'язані з різними зображеннями, та генерувати відповіді на них. Qwen-VL-Chat призначений для більш складної взаємодії. Наприклад, може порівнювати кілька зображень, відповідати на серії питань, писати історії з урахуванням наданих користувачем картинок. Наприклад, користувач може запитати ІІ про місцезнаходження лікарні по фото її вивіски та отримати точну відповідь на це питання.
Одна з переваг представлених мовних моделей полягає в тому, що вони працюють із високою точністю. За даними Alibaba, Qwen-VL значно перевершує існуючі схожі мовні моделі з відкритим вихідним кодом за декількома критеріями оцінки англійської мови. Алгоритм також підтримує нову функцію «спілкування з чергуванням кількох зображень», яка припускає, що користувач надасть ІІ кілька зображень, після чого ставитиме пов'язані з ними питання.
Використовуючи стандартні зразки, фахівці Alibaba оцінили можливості нових алгоритмів при виконанні різних завдань, починаючи від генерації коментарів до зображень та закінчуючи відповідями на запитання щодо завантажених знімків. Обидві моделі також тестувалися за розробленим в Alibaba еталоном, який ґрунтується на оцінці GPT-4 для визначення діалогових можливостей та відповідності людському сприйняттю. Зазначається, що Qwen-VL та Qwen-VL-Chat досягли найкращих результатів у різних категоріях.

Alibaba стала однією з перших китайських компаній, що представили конкурентоспроможну систему генеративного ІІ, що свідчить про швидкий прогрес досліджень у сфері нейромереж у Піднебесній. Випускаючи моделі з відкритим вихідним кодом, Alibaba гарантує, що дослідники, вчені та компанії по всьому світу зможуть використовувати їх для створення власних програм, не вдаючись до трудомісткого та дорогого процесу навчання нейромереж з нуля.

 

← Вернуться на предыдущую страницу

Читайте также:

Україна готується до можливого спалаху кору: МОЗ посилює вакцинацію та інфекційний контроль 1 августа 2025

В Україні фахівці системи охорони здоров’я готуються до можливого спалаху кору. Під час дводенної координаційної наради медичні служби разом із регіональними...

Сотні скасованих довідок: МОЗ та силовики масово перевіряють інвалідність посадовців 1 августа 2025

В Україні триває масштабна перевірка рішень про встановлення інвалідності посадовим особам. Міністерство охорони здоров’я разом зі Службою безпеки, ДБР...

Єфросиніна розказала про особливі стосунки з морем 1 августа 2025

Телеведуча Маша Єфросиніна, яка днями повернулася з Іспанії, продовжує спамити фото з відпочинку.

 

Вас могут заинтересовать эти отзывы

Зламанець Василій 0.3
Зламанець Василій

Отзывов: 1

Каталог отзывов





×

Выберите область поиска

  • Авто
  • Одяг / аксесуари
  • Роботодавці
  • Інше