11 августа 2025
Две независимые исследовательские компании протестировали только что выпущенную нейросеть GPT-5 и выявили критические уязвимости в её системе безопасности. NeuralTrust удалось взломать модель за один день, заставив её сгенерировать инструкцию по изготовлению зажигательной смеси в кустарных условиях. Компания SPLX, в свою очередь, обнаружила уязвимости к атакам с применением обфускации запросов.
Источник изображения: Viralyft/Unsplash
После того, как Grok-4 был взломан за два дня, GPT-5 был взломан теми же исследователями всего за 24 часа. Специалисты NeuralTrust использовали комбинацию собственной методики EchoChamber и техники сторителлинга (storytelling) — последовательного подталкивания ИИ к нужному ответу через рассказ захватывающих историй и серию уточняющих запросов, не содержащих явно запрещённых формулировок. В результате GPT-5, несмотря на встроенные защитные механизмы OpenAI, выдал детальное руководство по созданию кустарного оружия, сообщил портал SecurityWeek .
Как пояснили в NeuralTrust, проблема заключается в том, что система безопасности GPT-5 анализирует каждый запрос по отдельности, но не учитывает кумулятивный эффект многоэтапного диалога. Атакующие постепенно закрепляют нужный контекст, встраивая ключевые слова в безобидные фразы, а затем мягко подводят модель к генерации опасного контента.
Команда SPLX провела собственное тестирование, успешно применив атаку StringJoin Obfuscation, при которой в текст вставляются определённые символы, маскируя вредоносный запрос. Например, после серии наводящих вопросов модель согласилась подробно описать процесс изготовления запрещённого вещества, несмотря на системный запрет. Кроме того, в ходе сравнительного анализа с GPT-4o специалисты SPLX пришли к выводу, что предыдущая модель оказалась более надёжной в плане устойчивости к подобным атакам.
NeuralTrust и SPLX призвали компании проявлять осторожность при использовании «сырой» версии GPT-5 в бизнес-среде, особенно в сфере согласования бизнеса, когда все подразделения предприятия используют скоординированные стратегии, процессы и ресурсы для достижения общих целей. «Сырую модель GPT-5 практически невозможно использовать в корпоративных приложениях "из коробки". Даже внутренний уровень подсказок OpenAI оставляет значительные пробелы, особенно в области бизнес-согласования», — заявили в SPLX.
Хочешь узнать больше - читай отзывы
← Вернуться на предыдущую страницу
Енріке Іглесіас показав, як 5,5-річна донька від Курнікової вчила його молодіжних рухів 18 января 2026
50-річний іспанський співак Енріке Іглесіас у своєму Instagram показав, як його донька від російської тенісистки Анни Курнікової вчить татка молодіжним трендам.
Штучне Сонце на Землі першим запалить Китай — не пізніше 2030 року, пообіцяли вчені 18 января 2026
На профільній конференції Fusion Energy Technology and Industry Conference 2026 у Хефеї китайські вчені пообіцяли першими у світі досягти самопідтримувальної термоядерної реакції в реакторі типу токамак. Цим реактором стане установка Burning Plasma Experimental Superconducting Tokamak (BEST), першу плазму на якій планується отримати в 2027 році. До 2030 року BEST має продемонструвати або нульовий, або позитивний вихід енергії, чого ще не було досягнуто на Землі.
Золоті сережки: прикраса, яка вміє говорити без слів 18 января 2026
Є речі, які ми вибираємо не тому, що вони потрібні, а тому, що без них образ видається незавершеним. І сережки якраз із цієї категорії