Согласно открытому письму, «это действие лишило защитников [в сфере кибербезопасности] лучших моделей», которые теперь не могут использовать модели для поиска уязвимостей и повышения безопасности своего программного обеспечения и продуктов. «Отбирать лучшие возможности у защитников без веской причины, когда наши противники стремительно развиваются, опасно», — говорится в письме. В пятницу правительство США приказало Anthropic ограничить экспорт моделей Fable и Mythos, сославшись на соображения национальной безопасности, но не объяснив конкретных причин приказа, сообщили в Anthropic. В ответ компания приостановила доступ к моделям для всех пользователей по всему миру.
На момент написания материала письмо подписали 76 экспертов по кибербезопасности, в том числе Алекс Стамос, бывший глава службы безопасности Facebook; Кейси Эллис, основатель баг-баунти платформы Bugcrowd; Джон Каллас, известный криптограф и бывший менеджер по проектированию и архитектуре безопасности Apple; Пол Викси, специалист в области компьютерных наук; Дино Дай Зови, бывший руководитель прикладной инженерии безопасности в Block; Кэти Муссурис, основатель Luta Security; и Рэйчел Тобак, генеральный директор компании SocialProof Security, занимающейся обучением по вопросам осведомленности в области безопасности.
Когда Mythos была запущена в предварительном режиме в апреле, Anthropic заявила, что модель настолько эффективна в обнаружении уязвимостей, что компании необходимо строго ограничить доступ, чтобы не допустить её использования злоумышленниками или иностранными противниками для создания хаоса в интернете. На практике это означало, что первоначальный доступ к Mythos получили около 50 компаний, а недавно эта группа была расширена примерно до 150 организаций в 15 странах. На прошлой неделе Anthropic выпустила Fable — публичную версию Mythos, которая, по словам компании, имеет строгие ограничения, блокирующие её использование в сферах биологии, химии и кибербезопасности, а также предотвращающие дистилляцию модели для её воссоздания.
Ограничения в Fable оказались настолько строгими, что многие эксперты по кибербезопасности обнаружили, что модель отклоняет практически любые запросы, связанные с кибербезопасностью. В Anthropic заявили, что приказ Белого дома об экспортном контроле мог быть основан на отчёте о существовании метода обхода — или джейлбрейка — защиты Fable для разблокировки мощных возможностей уровня Mythos. По словам Кэти Муссурис, одной из подписантов открытого письма, этот метод был продемонстрирован исследователями Amazon в непубличной работе, с которой она ознакомилась. Однако в своём блоге Муссурис отметила, что документ фактически не демонстрирует реального джейлбрейка. Вместо этого, по её словам, исследователи просто попросили Fable исправить код с открытым исходным кодом с публичными и известными уязвимостями, а также «намеренно внедрёнными уязвимостями», после того как модель изначально отказалась «проверять код на наличие проблем с безопасностью». «Поведение, описанное в статье, не может быть осмысленно исправлено, и любая попытка только ослабит модель для защиты, — написала Муссурис. — Защитникам необходимо иметь возможность попросить ИИ исправить ошибки в файле, объяснить, почему исправление важно, и написать тесты, подтверждающие, что патч работает. Это не обход ограничений. Это самая ценная вещь, которую модель ИИ может сделать для защитной безопасности: выполнение цикла поиска, исправления и тестирования, который защитники проводят ежедневно».
Критика Муссурис была поддержана в открытом письме, где также говорится, что группа экспертов считает, что возможности моделей, описанные в статье Amazon, «могут быть воспроизведены» на GPT-5.5 от OpenAI, на публично доступных Claude Opus 4.8 и Sonnet от самой Anthropic, «и даже на китайских моделях, таких как Kimi 2.7». Муссурис сообщила TechCrunch, что «ошибки, использованные для демонстрации техник в статье, могут быть найдены с помощью других моделей. Метод в статье представляет собой технику обхода ограничений. Другие модели, не имеющие защитных ограничений Fable, часто не отказываются от прямого запроса на поиск ошибок безопасности, поэтому им не требуется обход». Письмо также содержит требование о прозрачном и справедливом применении нормативных актов, созданных в рамках «демократического процесса нормотворчества», основанных на научных исследованиях, проведённых отраслевыми и академическими экспертами, и «используемых лишь в минимальной степени, необходимой для обеспечения безопасности американской общественности».