26 мая 2026
Етика використання систем штучного інтелекту є нагальною проблемою, якою стурбовані не лише розробники, а й державні структури. Офіційні версШІ ШІ-моделей налаштовані так, щоб не давати відповідей на запити, спрямовані на отримання забороненої інформацШІ. Тим не менш, модифікація цих моделей дозволяє досить просто зняти всі подібні обмеження.
Джерело зображення: Unsplash, Steve A Johnson
Як повідомляє видання Financial Times, за його запитом дослідники групи Alice, які спеціалізуються на безпеці в сфері ШІ, провели ряд експериментів, довівши можливість обходу більшості етичних обмежень на сучасних ШІ-моделях популярних розробників. Принаймні, модифіковану версію моделі з відкритим вихідним кодом Google Gemma 3 автори експерименту змусили відповісти на запит про методику розпилення хлору в заповненому людьми приміщенні, згенерувати програмний код для викрадення даних кредитних карт, а також написати оповідання, сюжет яких передбачав розбещення неповнолітніх.
Подібні модифікації вихідних ШІ-моделей, за даними дослідників групи Alice, отримують певне поширення, нівелюючи зусилля законодавців і регуляторів щодо запобігання злонаміреному та кримінальному використанню ШІ. Програмні засоби для модифікації коду ПЗ поширюються незалежно від творців вихідних ШІ-моделей. Інструменти для декомпресії ШІ-моделей поширюються вільно і безкоштовно, зазначають автори дослідження.
На щастя, такі модифікації складно застосувати до ШІ-моделей з закритим вихідним кодом, але версії з відкритим кодом зазвичай відстають від пропрієтарних аналогів у своєму розвитку на шість або дванадцять місяців, і їх можливостей цілком достатньо зловмисникам для досягнення своїх цілей. Доступ до версій моделей зі знятими етичними обмеженнями можуть отримати й особи, які не мають серйозних технічних знань. Представникам Financial Times вдалося зняти такі обмеження самостійно з моделі Meta Llama 3.3, скориставшись програмним засобом Heretic. Для цього було достатньо додати чотири рядки коду і в цілому витратити близько 10 хвилин, після чого модифікована модель почала вільно обговорювати нюанси застосування отрут для вчинення вбивства.
Створювач Heretic зізнався, що за допомогою цього програмного засобу вже вдалося модифікувати більше 3500 моделей, а кількість завантажень модифікованих моделей досягла 13 млн з минулого року. З моделі Google Gemma 4 сам творець Heretic зняв обмеження протягом 90 хвилин після ШІ виходу. За словами експертів, виключення «шкідливого матеріалу» під час навчання ШІ-моделей не вирішує проблему, оскільки вони стають «занадто наївними» і не можуть достовірно визначити випадки власного злонаміреного використання. Представники GitHub пояснили наявність такого ПЗ на сторінках ресурсу тим, що воно може бути корисним для освітніх цілей і приносить користь всьому співтовариству фахівців з безпеки.
Хочеш дізнатися більше — читай відгуки
← Вернуться на предыдущую страницу
У Києві пошкоджено 300 об'єктів - Зеленський 26 мая 2026
У Києві пошкоджено 300 об'єктів - Зеленський
Шакіра зробила заяву про особисте життя та згадала Жерара Піке 26 мая 2026
49-річна артистка розказала, як ставиться до романів і за що вона вдячна Жерару Піке, який її зрадив
Петер Мадяр має намір скоротити свою зарплату вдвічі 26 мая 2026
Замість щедрих виплат свого попередника Віктора Орбана Мадяр планує отримувати лише прем’єрську зарплату та депутатське утримання - загалом близько 10 500 євро на місяць