24 сентября 2025
Компанія SplxAI, що працює у сфері кібербезпеки та спеціалізується на автоматизованому тестуванні безпеки систем штучного інтелекту (ШІ), продемонструвала можливість обманути ChatGPT і змусити його проходити тести CAPTCHA в режимі агента.
Джерело зображення: SplxAI
CAPTCHA розшифровується як «Повністю автоматизований публічний тест Тюрінга для розрізнення комп'ютерів і людей». Він, серед іншого, є одним із способів моніторингу активності ботів в інтернеті та покликаний запобігати публікації повідомлень ботами на сайтах і в соціальних мережах.
Більшість користувачів інтернету знайомі з головоломками CAPTCHA і ставляться до них по-різному. Зазвичай вони полягають у написанні послідовності букв або цифр, ледь розрізнюваних на зображенні, у розміщенні плиток у сітці зображень для завершення картинки або в ідентифікації об'єктів. З одного боку, веб-сайти використовують тести CAPTCHA, щоб упевнитися, що всі їхні користувачі — люди. Це запобігає спам-повідомленням від ботів. З іншого боку, тести можуть дратувати своєю складністю.
Тести CAPTCHA ніколи не були абсолютно надійним засобом від спаму, але до сих пір непогано справлялися з захистом форумів і розділів коментарів сайтів від ботів. Дослідники з SplxAI змогли знайти спосіб обманути ChatGPT і змусити його пройти тест CAPTCHA, використовуючи техніку, що називається «ін'єкцією підказок». При цьому йдеться не про просту допомогу людині з боку ChatGPT у вирішенні CAPTCHA, а про те, що ChatGPT в режимі агента може самостійно пройти тест, як якщо б це був людина — чого він робити не повинен.
Робота ChatGPT в режимі агента відрізняється від стандартного режиму. У цьому випадку ChatGPT отримує завдання, переходить у режим виконання і виконує його у фоновому режимі, надаючи користувачеві можливість займатися іншими справами. ChatGPT в режимі агента може використовувати веб-сайти як людина, але він все ж не повинен проходити тести CAPTCHA, оскільки вони призначені для виявлення ботів і запобігання їх активності, що порушує умови надання послуг. Дослідники встановили, що ChatGPT можна обманути і змусити «повірити» у фальшивість тесту CAPTCHA. У такому випадку він його пройде.
Дослідники запропонували ChatGPT пройти «фальшивий» тест CAPTCHA, створивши діалог, у якому чат-бот погодився його вирішити. Агент ChatGPT, враховуючи контекст попередніх взаємодій з дослідниками, не помітив або не розпізнав тривожних сигналів, що підштовхували його до виконання забороненої дії.
Цей процес багатоетапного впровадження підказок добре відомий хакерам і показує, наскільки вразливі до нього великі мовні моделі ШІ (LLM). Хоча дослідники виявили, що ChatGPT складніше справляється з CAPTCHA на основі зображень, він все ж пройшов і такі тести. Наслідки можуть бути досить серйозними, оскільки ChatGPT настільки широко поширений, що, потрапивши в руки зловмисників, може використовуватися спамерами і шахраями для заповнення розділів коментарів фальшивими повідомленнями та обходу обмежень на веб-сайтах, призначених лише для людей.
Хочеш дізнатися більше — читай відгуки
← Вернуться на предыдущую страницу
Лондон передумав передавати Києву активи РФ 21 декабря 2025
Британія не буде в односторонньому порядку використовувати заморожені активи РФ для допомоги Україні, оскільки планувала зробити це лише в тісній співпраці з Австралією, Канадою та ЄС.
Всі звільнені білоруські політв'язні виїхали з України в Польщу та Литву 21 декабря 2025
Колишні білоруські політв’язнів були успішно доставлені в Польщу та Литву, повідомив Координаційний штаб.
ChatGPT навчився змінювати свій характер за бажанням користувача 21 декабря 2025
В ChatGPT з'явилися нові функції персоналізації, які дозволяють регулювати емоційний тон і стиль відповідей штучного інтелекту (ШІ). OpenAI пропонує на вибір кілька варіантів «особистості» чат-бота, які можна донастроювати і «докрутити».