Claude Fable 5 возвращается: модель получила «чрезвычайно мощные» системы защиты

Andrew Romero | Среда, 1 июля, 2026, 09:50.

Andrew Romero | 1 июля 2026 г. — 9:50 PT

После того как работа модели Fable 5 была приостановлена по распоряжению правительства США, она возвращается в библиотеку Claude. Учитывая новые ограничения, не исключено, что Fable 5 теперь — это просто Opus 4.8 под маской.

Anthropic заявляет, что Fable 5 станет доступна пользователям по всему миру 1 июля. Возвращающаяся версия представляет собой «забарикадированный» вариант Fable 5, выпущенный из «соображений повышенной осторожности». Модель была переработана, чтобы эффективнее обрабатывать и прерывать задачи, связанные с кибербезопасностью, после того как ее изначально отключили из-за рисков безопасности.

В обновлении компании говорится, что исследователи Amazon уведомили правительство США о том, что нашли способ обойти механизмы защиты Fable 5. Метод Amazon заключался в том, чтобы дать модели задание на поиск ряда уязвимостей в программном обеспечении. Тестовый запрос был классифицирован как задача высокого уровня безопасности, хотя в Anthropic отмечают, что с ней справилась бы любая другая модель.

Claude Fable 5 will be available again globally tomorrow.

After a series of productive conversations with the US government, we’re redeploying the model with a new set of classifiers to target and block more cybersecurity tasks. In the near term, some routine tasks like coding…

— Anthropic (@AnthropicAI) 1 июля 2026 г.

Anthropic утверждает, что их собственное тестирование дало такие же результаты с менее мощными моделями других разработчиков, такими как Opus 4.8 и GPT-5.5. Более того, каждая протестированная Anthropic модель выдала аналогичные результаты при эксплуатации этой уязвимости, и ни один из этих результатов не выявил каких-либо уникальных возможностей уровня Mythos.

Наше тестирование подтвердило, что многие менее способные модели, включая Claude Opus 4.8, GPT-5.5 и Kimi K2.7, могли идентифицировать те же уязвимости, что и Fable 5 в отчете. Когда дело дошло до демонстрации того, как эксплуатировать эту уязвимость, каждая протестированная нами модель могла выдать тот же результат, что и Fable 5 (включая Claude Haiku 4.5, Sonnet 4.6, Opus 4.6, Opus 4.7, Opus 4.8, GPT-5.4, GPT-5.5 и Kimi K2.7).

Спустя почти месяц Claude Fable 5 возвращается в ограниченном виде. Меры безопасности были усилены, чтобы они срабатывали гораздо чаще, чем в предыдущей версии.

У обновленной Fable 5 есть пара недостатков. Anthropic заявляет, что сложная модель не сможет справляться со всеми задачами — не из-за отсутствия технических возможностей, а из-за наложенных ограничений. При выполнении рутинных задач может появляться уведомление о том, что модель должна переключиться обратно на Opus 4.8. По словам представителей компании, это может происходить при написании и отладке кода.

В тесном сотрудничестве с правительством мы обучили улучшенный классификатор безопасности, который нацелен на блокировку поведения, описанного в отчете. Пользователи будут получать уведомления, если запрос к Fable 5 будет заблокирован, и вместо этого запрос будет перенаправлен на Opus 4.8.

Когда Fable 5 была запущена изначально, Anthropic делала такое же предостережение, отмечая, что некоторые пользователи могут увидеть откат модели к предыдущей версии, если запрос является рискованным. Суть этого предупреждения не изменилась, но сами правила стали гораздо строже.

Возможно, это не коснется 99% задач, но вероятность того, что Fable 5 сама себя «зацензурит» и переключится на более безопасную модель, теперь выше. По мнению исследователей из CAISI, новые системы защиты являются «чрезвычайно мощными».

Claude Fable 5 и Mythos 5 имеют много общих архитектурных основ, хотя последняя гораздо больше подходит для решения задач по кибербезопасности, которых Fable 5, судя по всему, изначально была призвана избегать. В любом случае, обе модели предназначены для очень сложных задач, а не для повседневного общения с чат-ботом. По этой причине Anthropic не предоставит пользователям свободный доступ к модели без учета лимитов использования.

Сообщается, что Claude Fable 5 станет доступна для использования 1 июля. Как и в первый раз, она будет потреблять гораздо больше токенов, а лимиты использования будут расходоваться гораздо быстрее. В Anthropic уточнили, что планы Pro, Max, Team и отдельные корпоративные тарифы смогут использовать модель с 50% от их лимита. В дальнейшем она будет доступна только через дополнительные кредиты на использование.