8 октября 2025
Компанія Google представила попередню версію нової ІІ-моделі Gemini 2.5 з функцією Computer Use, яка здатна взаємодіяти з веб-сайтами через браузер, імітуючи дії людини. Модель застосовує візуальне розуміння та логічне міркування для виконання, наприклад, таких завдань, як заповнення та відправка форм без використання API або іншого програмного інтерфейсу.
Джерело зображення: Solen Feyissa/Unsplash
Як повідомляє The Verge, модель Gemini 2.5 Computer Use призначена для роботи з користувацькими інтерфейсами, створеними для людей, а не для автоматизованих систем. За словами Google, технологія вже застосовувалася в агентських функціях AI Mode та в дослідницькому прототипі Project Mariner, де ІІ-агенти самостійно виконували завдання в браузері, наприклад, додавали товари в кошик на основі списку інгредієнтів.
Цікаво, що анонс нової моделі відбувся через день після того, як OpenAI представила нові додатки для ChatGPT в рамках щорічного заходу Dev Day, продовживши розвиток функції ChatGPT Agent, здатної виконувати складні завдання від імені користувача. При цьому Anthropic ще в минулому році випустила версію моделі Claude з функцією Computer Use. Однак Google стверджує, що її модель «перевершує провідні аналоги за кількома веб- та мобільними бенчмарками».
На відміну від ChatGPT Agent та інструмента Anthropic, Gemini 2.5 Computer Use має доступ лише до браузера, а не до всієї операційної системи. Google підкреслила, що рішення «поки не оптимізоване для управління на рівні настільної ОС» і підтримує 13 дій, включаючи відкриття веб-браузера, введення тексту, а також перетягування елементів.
Повідомляється, що модель вже доступна розробникам через платформи Google AI Studio та Vertex AI. Крім того, публічна демонстрація розміщена у віртуальному браузері BrowserBase, де можна спостерігати, як ІІ виконує такі завдання, як «зіграти в гру 2048» або «переглянути Hacker News у пошуках обговорюваних тем».
Хочеш дізнатися більше — читай відгуки
← Вернуться на предыдущую страницу
Fox придбала конкурента Netflix за 22 мільярди доларів 16 июня 2026
Американська телевізійна компанія Fox оголосила про придбання стримінгової платформи Roku за 22 мільярди доларів, що, як очікується, дозволить розширити онлайн-охоплення спортивного та новинного контенту Fox, а також зміцнити її позиції на рекламному ринку.
Нові імена, російські пісні та ШІ: що відбувається з трендами та які пісні зараз слухають українці 16 июня 2026
Нові імена, російські пісні та ШІ: що відбувається з трендами та які пісні зараз слухають українці Найпомітніший тренд – стрімке зростання популярності музики, створеної за допомогою ШІ
Нетаньягу: З угодою чи без, Іран не матиме ядерної зброї 16 июня 2026
Ізраїль не має наміру виводити війська з південного Лівану, Гази чи Сирії, дав зрозуміти ізраїльський прем'єр.