ТОнеТО | Змусити ШІ видавати заборонену інформацію досить просто, як продемонстрували дослідники | Новости про товары, услуги, компании, технологии

Змусити ШІ видавати заборонену інформацію досить просто, як продемонстрували дослідники

26 мая 2026

Етика використання систем штучного інтелекту є нагальною проблемою, якою стурбовані не лише розробники, а й державні структури. Офіційні версШІ ШІ-моделей налаштовані так, щоб не давати відповідей на запити, спрямовані на отримання забороненої інформацШІ. Тим не менш, модифікація цих моделей дозволяє досить просто зняти всі подібні обмеження.

Геміні та штучний інтелект: Unsplash, Steve A Johnson

Джерело зображення: Unsplash, Steve A Johnson

Як повідомляє видання Financial Times, за його запитом дослідники групи Alice, які спеціалізуються на безпеці в сфері ШІ, провели ряд експериментів, довівши можливість обходу більшості етичних обмежень на сучасних ШІ-моделях популярних розробників. Принаймні, модифіковану версію моделі з відкритим вихідним кодом Google Gemma 3 автори експерименту змусили відповісти на запит про методику розпилення хлору в заповненому людьми приміщенні, згенерувати програмний код для викрадення даних кредитних карт, а також написати оповідання, сюжет яких передбачав розбещення неповнолітніх.

Подібні модифікації вихідних ШІ-моделей, за даними дослідників групи Alice, отримують певне поширення, нівелюючи зусилля законодавців і регуляторів щодо запобігання злонаміреному та кримінальному використанню ШІ. Програмні засоби для модифікації коду ПЗ поширюються незалежно від творців вихідних ШІ-моделей. Інструменти для декомпресії ШІ-моделей поширюються вільно і безкоштовно, зазначають автори дослідження.

На щастя, такі модифікації складно застосувати до ШІ-моделей з закритим вихідним кодом, але версії з відкритим кодом зазвичай відстають від пропрієтарних аналогів у своєму розвитку на шість або дванадцять місяців, і їх можливостей цілком достатньо зловмисникам для досягнення своїх цілей. Доступ до версій моделей зі знятими етичними обмеженнями можуть отримати й особи, які не мають серйозних технічних знань. Представникам Financial Times вдалося зняти такі обмеження самостійно з моделі Meta Llama 3.3, скориставшись програмним засобом Heretic. Для цього було достатньо додати чотири рядки коду і в цілому витратити близько 10 хвилин, після чого модифікована модель почала вільно обговорювати нюанси застосування отрут для вчинення вбивства.

Створювач Heretic зізнався, що за допомогою цього програмного засобу вже вдалося модифікувати більше 3500 моделей, а кількість завантажень модифікованих моделей досягла 13 млн з минулого року. З моделі Google Gemma 4 сам творець Heretic зняв обмеження протягом 90 хвилин після ШІ виходу. За словами експертів, виключення «шкідливого матеріалу» під час навчання ШІ-моделей не вирішує проблему, оскільки вони стають «занадто наївними» і не можуть достовірно визначити випадки власного злонаміреного використання. Представники GitHub пояснили наявність такого ПЗ на сторінках ресурсу тим, що воно може бути корисним для освітніх цілей і приносить користь всьому співтовариству фахівців з безпеки.

Выберите область поиска

Змусити ШІ видавати заборонену інформацію досить просто, як продемонстрували дослідники

Читайте также:

Вас могут заинтересовать эти отзывы

Удалить фото?

Фото удалено

Выберите область поиска