ТОнеТО | Google представила модель Gemini, яка заповнює у браузері форми та грає в 2048 | Новости про товары, услуги, компании, технологии

Google представила модель Gemini, яка заповнює у браузері форми та грає в 2048

8 октября 2025

Компанія Google представила попередню версію нової ІІ-моделі Gemini 2.5 з функцією Computer Use, яка здатна взаємодіяти з веб-сайтами через браузер, імітуючи дії людини. Модель застосовує візуальне розуміння та логічне міркування для виконання, наприклад, таких завдань, як заповнення та відправка форм без використання API або іншого програмного інтерфейсу.

Геміні та штучний інтелект: Solen Feyissa/Unsplash

Джерело зображення: Solen Feyissa/Unsplash

Як повідомляє The Verge, модель Gemini 2.5 Computer Use призначена для роботи з користувацькими інтерфейсами, створеними для людей, а не для автоматизованих систем. За словами Google, технологія вже застосовувалася в агентських функціях AI Mode та в дослідницькому прототипі Project Mariner, де ІІ-агенти самостійно виконували завдання в браузері, наприклад, додавали товари в кошик на основі списку інгредієнтів.

Цікаво, що анонс нової моделі відбувся через день після того, як OpenAI представила нові додатки для ChatGPT в рамках щорічного заходу Dev Day, продовживши розвиток функції ChatGPT Agent, здатної виконувати складні завдання від імені користувача. При цьому Anthropic ще в минулому році випустила версію моделі Claude з функцією Computer Use. Однак Google стверджує, що її модель «перевершує провідні аналоги за кількома веб- та мобільними бенчмарками».

На відміну від ChatGPT Agent та інструмента Anthropic, Gemini 2.5 Computer Use має доступ лише до браузера, а не до всієї операційної системи. Google підкреслила, що рішення «поки не оптимізоване для управління на рівні настільної ОС» і підтримує 13 дій, включаючи відкриття веб-браузера, введення тексту, а також перетягування елементів.

Повідомляється, що модель вже доступна розробникам через платформи Google AI Studio та Vertex AI. Крім того, публічна демонстрація розміщена у віртуальному браузері BrowserBase, де можна спостерігати, як ІІ виконує такі завдання, як «зіграти в гру 2048» або «переглянути Hacker News у пошуках обговорюваних тем».

Выберите область поиска

Google представила модель Gemini, яка заповнює у браузері форми та грає в 2048

Читайте также:

Вас могут заинтересовать эти отзывы

Удалить фото?

Фото удалено

Выберите область поиска