Anthropic возвращает Claude Fable 5 пользователям по всему миру. Модель снова появится в Claude.ai, Claude Platform, Claude Code и Claude Cowork с 1 июля 2026 года. Доступ к ней отключали после экспортных ограничений США, введённых 12 июня для двух новых моделей компании — Fable 5 и Mythos 5. Из-за срочного характера решения Anthropic не могла быстро проверять гражданство пользователей в реальном времени, поэтому временно закрыла обе модели для всех. 30 июня ограничения сняли.
Fable 5 возвращается глобально, а Mythos 5 пока снова доступна только части организаций в США. Anthropic пишет, что Mythos 5 открыли отдельному набору американских организаций после одобрения 26 июня, а расширение доступа для внутренних и международных партнёров Project Glasswing ещё согласуют.
Главное для обычных пользователей: Fable 5 можно будет тратить внутри недельных лимитов, но только временно. Для Pro, Max, Team и отдельных Enterprise-планов модель будет включена в подписку до 7 июля — максимум до 50% недельного лимита. После этой даты Fable 5 переведут на отдельные кредиты за использование. Для энтерпрайза встроенного лимита не будет: без включённых кредитов модель просто не заработает.
Fable 5 и Mythos 5 вышли 9 июня. Обе модели используют одну базовую архитектуру, но отличаются уровнем ограничений. Fable 5 Anthropic выпускала как версию для широкого использования с усиленными защитными механизмами. Mythos 5 получила меньше ограничений и изначально предназначалась для узкого круга доверенных партнёров Project Glasswing, которые занимаются оборонительной кибербезопасностью.
Причиной паузы стал отчёт исследователей Amazon. Они нашли способ обойти защиту Fable 5 и добиться от модели поиска нескольких уязвимостей в ПО. В одном случае модель выдала код, который демонстрировал эксплуатацию уязвимости. После проверки Anthropic заявила, что этот сценарий не открывал уникальные возможности уровня Mythos 5 и больше был похож на пограничный случай в правилах Fable 5: часть безопасных задач по защите систем модель блокирует заранее, потому что они могут выглядеть как подготовка атаки.
Компания также проверила схожие запросы на других моделях. Внутренние тесты Anthropic показали, что те же уязвимости могли находить и менее мощные системы, включая Claude Opus 4.8, GPT-5.5 и Kimi K2.7. Демонстрацию эксплуатации одной уязвимости, о которой шла речь в отчёте Amazon, могли сгенерировать все протестированные модели из набора Anthropic, включая Claude Haiku 4.5, Sonnet 4.6, Opus 4.6, Opus 4.7, Opus 4.8, GPT-5.4, GPT-5.5 и Kimi K2.7.
После этого Anthropic дообучила новый защитный классификатор. Классификатор — это отдельная автоматическая система, которая смотрит на запрос и ответ модели и решает, не похожа ли задача на потенциально вредную киберактивность. Если запрос к Fable 5 срабатывает на блокировку, пользователь увидит уведомление, а запрос перекинут на Opus 4.8. Компания утверждает, что новый фильтр блокирует описанный в отчёте Amazon обход больше чем в 99% случаев.
Цена такой защиты — больше ложных срабатываний. Anthropic прямо предупреждает, что новый классификатор чаще будет ошибочно флагировать нормальные задачи по программированию и отладке.
Для Fable 5 компания использует подход «защита в глубину». Она включает несколько слоёв: обучение модели отказываться от опасных запросов, автоматические классификаторы, анализ паттернов злоупотреблений и дополнительный запас прочности. То есть, если запрос выглядит как киберзадача и не выглядит явно безопасным, фильтр может заблокировать его заранее.
В Anthropic отдельно признают, что абсолютной защиты от jailbreak не бывает. Jailbreak — это способ сформулировать запрос так, чтобы модель или фильтр пропустили то, что должны были остановить. Компания делит такие обходы на несколько уровней: мелкие обходы, узкие вредные обходы и универсальные jailbreak, которые снимают широкий класс ограничений. Для Fable 5 универсальных обходов на момент публикации не нашли, но модель продолжают проверять специалисты по безопасности.
Для внешних исследователей компания запускает программу на HackerOne, куда можно будет отправлять потенциальные кибер-jailbreak для Fable 5 после возвращения модели.
Отдельные медиа указывают, что снятие ограничений оформлено через письмо Министерства торговли США: лицензия на экспорт, реэкспорт и передачу внутри страны для Fable 5 и Mythos 5 больше не требуется. WIRED пишет, что Anthropic согласилась активнее выявлять и закрывать риски безопасности, работать с госструктурами над протоколами выпуска моделей и информировать о вредоносной активности.
Есть новость? Станьте автором.
Мы сотрудничаем с независимыми исследователями и специалистами по кибербезопасности. Отправьте нам новость или предложите статью на рассмотрение редакции.