
После того как работа модели Fable 5 была приостановлена по распоряжению правительства США, она возвращается в библиотеку Claude. Учитывая новые ограничения, не исключено, что Fable 5 теперь — это просто Opus 4.8 под маской.
Anthropic заявляет, что Fable 5 станет доступна пользователям по всему миру 1 июля. Возвращающаяся версия представляет собой «забарикадированный» вариант Fable 5, выпущенный из «соображений повышенной осторожности». Модель была переработана, чтобы эффективнее обрабатывать и прерывать задачи, связанные с кибербезопасностью, после того как ее изначально отключили из-за рисков безопасности.
В обновлении компании говорится, что исследователи Amazon уведомили правительство США о том, что нашли способ обойти механизмы защиты Fable 5. Метод Amazon заключался в том, чтобы дать модели задание на поиск ряда уязвимостей в программном обеспечении. Тестовый запрос был классифицирован как задача высокого уровня безопасности, хотя в Anthropic отмечают, что с ней справилась бы любая другая модель.
Anthropic утверждает, что их собственное тестирование дало такие же результаты с менее мощными моделями других разработчиков, такими как Opus 4.8 и GPT-5.5. Более того, каждая протестированная Anthropic модель выдала аналогичные результаты при эксплуатации этой уязвимости, и ни один из этих результатов не выявил каких-либо уникальных возможностей уровня Mythos.
Наше тестирование подтвердило, что многие менее способные модели, включая Claude Opus 4.8, GPT-5.5 и Kimi K2.7, могли идентифицировать те же уязвимости, что и Fable 5 в отчете. Когда дело дошло до демонстрации того, как эксплуатировать эту уязвимость, каждая протестированная нами модель могла выдать тот же результат, что и Fable 5 (включая Claude Haiku 4.5, Sonnet 4.6, Opus 4.6, Opus 4.7, Opus 4.8, GPT-5.4, GPT-5.5 и Kimi K2.7).
Спустя почти месяц Claude Fable 5 возвращается в ограниченном виде. Меры безопасности были усилены, чтобы они срабатывали гораздо чаще, чем в предыдущей версии.
У обновленной Fable 5 есть пара недостатков. Anthropic заявляет, что сложная модель не сможет справляться со всеми задачами — не из-за отсутствия технических возможностей, а из-за наложенных ограничений. При выполнении рутинных задач может появляться уведомление о том, что модель должна переключиться обратно на Opus 4.8. По словам представителей компании, это может происходить при написании и отладке кода.
В тесном сотрудничестве с правительством мы обучили улучшенный классификатор безопасности, который нацелен на блокировку поведения, описанного в отчете. Пользователи будут получать уведомления, если запрос к Fable 5 будет заблокирован, и вместо этого запрос будет перенаправлен на Opus 4.8.
Когда Fable 5 была запущена изначально, Anthropic делала такое же предостережение, отмечая, что некоторые пользователи могут увидеть откат модели к предыдущей версии, если запрос является рискованным. Суть этого предупреждения не изменилась, но сами правила стали гораздо строже.
Возможно, это не коснется 99% задач, но вероятность того, что Fable 5 сама себя «зацензурит» и переключится на более безопасную модель, теперь выше. По мнению исследователей из CAISI, новые системы защиты являются «чрезвычайно мощными».
Claude Fable 5 и Mythos 5 имеют много общих архитектурных основ, хотя последняя гораздо больше подходит для решения задач по кибербезопасности, которых Fable 5, судя по всему, изначально была призвана избегать. В любом случае, обе модели предназначены для очень сложных задач, а не для повседневного общения с чат-ботом. По этой причине Anthropic не предоставит пользователям свободный доступ к модели без учета лимитов использования.
Сообщается, что Claude Fable 5 станет доступна для использования 1 июля. Как и в первый раз, она будет потреблять гораздо больше токенов, а лимиты использования будут расходоваться гораздо быстрее. В Anthropic уточнили, что планы Pro, Max, Team и отдельные корпоративные тарифы смогут использовать модель с 50% от их лимита. В дальнейшем она будет доступна только через дополнительные кредиты на использование.