Решение Министерства торговли США ввести экспортные ограничения на модель Anthropic Fable 5 вызвало заметный раскол в экспертном сообществе кибербезопасности. Ряд специалистов утверждает, что модель не обладает уникальными возможностями, которые оправдывали бы столь жёсткие меры.

Ограничения были введены американской администрацией на фоне сообщений о возможных попытках «джейлбрейка» модели вскоре после её выпуска. По версии регуляторов, если исследователи внутри страны смогли обойти защитные механизмы, то аналогичные методы потенциально могут быть использованы иностранными государствами и злоумышленниками. После этого Anthropic временно отключила доступ к модели для части пользователей, одновременно пытаясь добиться пересмотра решения со стороны Белого дома.

Эксперт по кибербезопасности Кэти Муссурис сообщила, что исследователи пытались использовать модели Anthropic, включая Fable 5, Mythos и Claude Opus, для анализа уязвимостей в открытом программном коде. По её словам, Fable 5 изначально отказывалась выполнять часть запросов, однако затем с помощью многоэтапного процесса удалось добиться генерации скриптов для тестирования исправлений. Муссурис подчеркнула, что подобные возможности являются стандартной частью практик защитной кибербезопасности, где ИИ применяется для поиска ошибок, объяснения исправлений и проверки патчей, и это не представляет собой обход защитных механизмов, а наоборот — ключевой инструмент кибербезопасности.

Ряд экспертов, подписавших открытое обращение к администрации США, также отмечают, что аналогичные возможности присутствуют у других моделей, включая разработки OpenAI и альтернативные системы. При этом они указывают, что «уровень джейлбрейка Fable 5 не выходит за пределы того, что уже наблюдалось в индустрии». Специалисты отдельно критикуют сам подход к регулированию: по их мнению, решение об экспортных ограничениях было принято без прозрачной и единообразной оценки рисков, а также без сопоставления с другими коммерческими моделями, обладающими сопоставимыми возможностями в сфере анализа уязвимостей.

Сенатор Марк Уорнер заявил, что ограничения должны основываться на прозрачной и формализованной системе оценки рисков, а не на разрозненных исследованиях. Он призвал Конгресс США разработать единые правила регулирования моделей, чтобы избежать политизированных решений и обеспечить предсказуемость для отрасли.

По данным Anthropic, модель Fable 5 проходила масштабное тестирование с участием внутренних и внешних команд, суммарно около 1000 часов, в ходе которого не было выявлено универсальных способов обхода защитных механизмов. Поддержавшие критику эксперты отмечают, что аналогичные уязвимости и сценарии тестирования воспроизводятся и в других системах — включая модели OpenAI, Anthropic Claude и ряд китайских решений, — что ставит под сомнение тезис об «уникальной опасности Fable 5».

На фоне растущего давления общества на регулирование ИИ тема безопасности моделей всё чаще становится предметом политических решений. Однако текущий спор вокруг Fable 5 демонстрирует важную проблему отрасли: отсутствие единых критериев, по которым можно объективно оценить, где заканчивается исследовательская устойчивость модели и начинается реальная угроза безопасности.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *