11 августа 2025
Две независимые исследовательские компании протестировали только что выпущенную нейросеть GPT-5 и выявили критические уязвимости в её системе безопасности. NeuralTrust удалось взломать модель за один день, заставив её сгенерировать инструкцию по изготовлению зажигательной смеси в кустарных условиях. Компания SPLX, в свою очередь, обнаружила уязвимости к атакам с применением обфускации запросов.
Источник изображения: Viralyft/Unsplash
После того, как Grok-4 был взломан за два дня, GPT-5 был взломан теми же исследователями всего за 24 часа. Специалисты NeuralTrust использовали комбинацию собственной методики EchoChamber и техники сторителлинга (storytelling) — последовательного подталкивания ИИ к нужному ответу через рассказ захватывающих историй и серию уточняющих запросов, не содержащих явно запрещённых формулировок. В результате GPT-5, несмотря на встроенные защитные механизмы OpenAI, выдал детальное руководство по созданию кустарного оружия, сообщил портал SecurityWeek .
Как пояснили в NeuralTrust, проблема заключается в том, что система безопасности GPT-5 анализирует каждый запрос по отдельности, но не учитывает кумулятивный эффект многоэтапного диалога. Атакующие постепенно закрепляют нужный контекст, встраивая ключевые слова в безобидные фразы, а затем мягко подводят модель к генерации опасного контента.
Команда SPLX провела собственное тестирование, успешно применив атаку StringJoin Obfuscation, при которой в текст вставляются определённые символы, маскируя вредоносный запрос. Например, после серии наводящих вопросов модель согласилась подробно описать процесс изготовления запрещённого вещества, несмотря на системный запрет. Кроме того, в ходе сравнительного анализа с GPT-4o специалисты SPLX пришли к выводу, что предыдущая модель оказалась более надёжной в плане устойчивости к подобным атакам.
NeuralTrust и SPLX призвали компании проявлять осторожность при использовании «сырой» версии GPT-5 в бизнес-среде, особенно в сфере согласования бизнеса, когда все подразделения предприятия используют скоординированные стратегии, процессы и ресурсы для достижения общих целей. «Сырую модель GPT-5 практически невозможно использовать в корпоративных приложениях "из коробки". Даже внутренний уровень подсказок OpenAI оставляет значительные пробелы, особенно в области бизнес-согласования», — заявили в SPLX.
Хочешь узнать больше - читай отзывы
← Вернуться на предыдущую страницу
Вживання щавлю вкрай небезпечне для певної групи людей 20 марта 2026
Ми звикли вважати щавель простою їжею. Але насправді він може бути небезпечним.
Угорщина політизує питання "Дружби" - МЗС України 20 марта 2026
Замість того, щоб пояснити громадянам Угорщини, чому країна не змогла диверсифікувати постачання енергоносіїв, прем'єр-міністр Віктор Орбан у своїй риториці зосереджується на Україні, зазначив речник українського відомства.
Трамп нагадав про Перл-Гарбор під час зустрічі із прем’єркою Японії 20 марта 2026
На запитання, чому США не повідомили союзників про атаку на Іран, звертаючись до Такаїчі, Трам сказав: "Хто знає про несподіванки краще за Японію? Чому ви не розповіли мені про Перл-Гарбор?"