Во вторник компания Anthropic публично выпустила Claude Fable 5, свою первую модель класса "Mythos", которая, по их утверждению, превосходит предыдущие модели Opus по общим возможностям. Однако запуск модели сопровождается мерами предосторожности, направленными на предотвращение ответов на запросы по таким темам, как кибербезопасность, биология и химия, поскольку компания публично выразила обеспокоенность по поводу потенциального воздействия на "повышение" возможностей злонамеренных пользователей. Anthropic заявляет, что Fable 5 работает на "той же базовой модели", что и Mythos 5, который сегодня выходит из многомесячного периода "Mythos Preview", но только для "небольшой группы киберзащитников", признанных надежными в рамках существующего проекта Project Glasswing.

В отличие от Mythos 5, публично доступный Fable 5 настроен таким образом, чтобы перенаправлять запросы по определенным чувствительным темам на более раннюю модель Claude Opus 4.8 и предупреждать пользователя, когда это происходит. Среди множества заявленных улучшений в Fable 5, особенно значительным оказался скачок в области кибербезопасности.

Anthropic заявила, что настроила эти меры предосторожности так, чтобы они были "строже, чем идеальные", что означает, что система может иногда отказывать в "безобидных запросах", признавая, что это может быть неприятно для обычных пользователей. Однако Anthropic утверждает, что такие ложные срабатывания возникают менее чем в пяти процентах всех тестовых сессий и что это оправдано для предотвращения ситуаций, когда Mythos мог бы помочь злонамеренным пользователям в "причинении серьезного вреда, который они не могли бы получить из других источников".

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *