8 октября 2025
Компанія Google представила попередню версію нової ІІ-моделі Gemini 2.5 з функцією Computer Use, яка здатна взаємодіяти з веб-сайтами через браузер, імітуючи дії людини. Модель застосовує візуальне розуміння та логічне міркування для виконання, наприклад, таких завдань, як заповнення та відправка форм без використання API або іншого програмного інтерфейсу.
Джерело зображення: Solen Feyissa/Unsplash
Як повідомляє The Verge, модель Gemini 2.5 Computer Use призначена для роботи з користувацькими інтерфейсами, створеними для людей, а не для автоматизованих систем. За словами Google, технологія вже застосовувалася в агентських функціях AI Mode та в дослідницькому прототипі Project Mariner, де ІІ-агенти самостійно виконували завдання в браузері, наприклад, додавали товари в кошик на основі списку інгредієнтів.
Цікаво, що анонс нової моделі відбувся через день після того, як OpenAI представила нові додатки для ChatGPT в рамках щорічного заходу Dev Day, продовживши розвиток функції ChatGPT Agent, здатної виконувати складні завдання від імені користувача. При цьому Anthropic ще в минулому році випустила версію моделі Claude з функцією Computer Use. Однак Google стверджує, що її модель «перевершує провідні аналоги за кількома веб- та мобільними бенчмарками».
На відміну від ChatGPT Agent та інструмента Anthropic, Gemini 2.5 Computer Use має доступ лише до браузера, а не до всієї операційної системи. Google підкреслила, що рішення «поки не оптимізоване для управління на рівні настільної ОС» і підтримує 13 дій, включаючи відкриття веб-браузера, введення тексту, а також перетягування елементів.
Повідомляється, що модель вже доступна розробникам через платформи Google AI Studio та Vertex AI. Крім того, публічна демонстрація розміщена у віртуальному браузері BrowserBase, де можна спостерігати, як ІІ виконує такі завдання, як «зіграти в гру 2048» або «переглянути Hacker News у пошуках обговорюваних тем».
Хочеш дізнатися більше — читай відгуки
← Вернуться на предыдущую страницу
Microsoft анонсувала найбільш очікуване оновлення Windows — користувачам нададуть контроль над оновленнями 22 марта 2026
Microsoft анонсувала масштабні зміни в системі розповсюдження оновлень своєї операційної системи. Голова підрозділу Windows Паван Давулурі пообіцяв, що в майбутньому користувачі зможуть призупиняти встановлення патчів «на стільки, скільки потрібно». Також власники комп'ютерів отримають можливість перезавантажувати або вимикати пристрій без примусової установки оновлень.
Харчова звичка, яка допоможе людині уникнути інсульту 22 марта 2026
Виявляється, що потрібно додавати в їжу соняшникову олію.
Пошук Google почав підміняти заголовки новин, згенерованими штучним інтелектом і не цурається спотворення сенсу 22 марта 2026
Пошукова система Google почала замінювати оригінальні заголовки новинних статей на варіанти, згенеровані штучним інтелектом. Раніше подібна практика була впроваджена в стрічку Google Discover, тепер зміни торкнулися й традиційної видачі. Видання The Verge виявило кілька випадків, коли Google замінював авторські заголовки на власні, при цьому іноді спотворюючи їхній зміст.