Anthropic выпустила Claude Opus 4.8 — новую версию флагманской модели Claude. Обновление рассчитано на разработчиков, команды с большими кодовыми базами. Новая модель должна лучше понимать, когда она не уверена, чаще замечать проблемы в собственном коде, дольше держать фокус на задаче и аккуратнее работать как агент.
Anthropic также добавила Dynamic Workflows для Claude Code. Это исследовательская функция, при которой Claude может разбивать большую задачу на части, запускать сотни субагентов в одной сессии, проверять их результаты и собирать финальный ответ. Пример из релиза — миграция кодовой базы на сотни тысяч строк от постановки задачи до merge при опоре на существующие тесты.
Claude Opus 4.8 стала следующей моделью класса Opus после Opus 4.7. Anthropic называет обновление «умеренным, но ощутимым» шагом вперёд. Заметный акцент сделан на трёх направлениях:
-
код и разработка;
-
агентные задачи, где модель работает с инструментами и не требует постоянных уточнений;
-
профессиональная работа с длинным контекстом, документами, анализом и проверкой выводов.
Модель доступна в Claude, Claude Code и через API под именем claude-opus-4-8. Обычная цена не изменилась относительно Opus 4.7: $5 за миллион входящих токенов и $25 за миллион исходящих. Для fast mode указана отдельная цена — $10 за миллион входящих токенов и $50 за миллион исходящих. Этот режим работает примерно в 2,5 раза быстрее, а его стоимость стала в три раза ниже, чем у fast mode в предыдущих моделях Opus.
Улучшение модели без роста базовой цены снижает барьер для перехода с Opus 4.7, но fast mode всё ещё дороже обычного режима.
Один из главных пунктов релиза — «честность» модели. Речь не о морали, а о более приземлённой проблеме больших языковых моделей: они могут уверенно сообщать о прогрессе или правильности решения, когда доказательств мало.
Anthropic утверждает, что Opus 4.8 примерно в четыре раза реже, чем Opus 4.7, оставляет без комментария дефекты в коде, который сама написала. Проще говоря, модель должна чаще замечать: «здесь есть риск», «этот участок надо проверить», «я не уверен в корректности решения», «план выглядит слабым».
Ранние тестеры, которых цитирует Anthropic, описывали Opus 4.8 как более строгого напарника: модель чаще задаёт уточняющие вопросы, не соглашается с плохим планом и лучше удерживает контекст многошаговой работы.
Самое технически интересное обновление — Dynamic Workflows в Claude Code. Функция доступна как исследовательского превью для тарифов Enterprise, Team и Max.
Идея простая: большая задача не должна превращаться в один длинный поток рассуждений. Claude может составить план, разделить работу на блоки, запустить много субагентов, получить от них результаты, проверить выводы и уже после этого вернуть итог пользователю.
Anthropic приводит сценарий миграции большой кодовой базы. Например, нужно обновить API, заменить устаревший паттерн, пройтись по множеству сервисов и довести изменения до состояния, при котором проходят тесты. Раньше такой процесс требовал множества отдельных запросов и ручной координации. Dynamic Workflows пытается перенести часть этой координации внутрь Claude Code.
В Claude появился новый контроль уровня усилия. Пользователь может выбрать, сколько ресурсов модель тратит на задачу.
Низкий уровень даёт более быстрый ответ и медленнее расходует лимиты. Высокий уровень заставляет модель чаще и глубже рассуждать. Opus 4.8 по умолчанию работает в high effort — Anthropic считает этот режим лучшим балансом качества и удобства.
Для Claude Code доступны еще более сложные режимы: extra, он же xhigh, и max. Их предлагают использовать для сложных задач и долгих агентных сценариев. Такой режим тратит больше токенов, зато может дать более качественную проверку и меньше незаметных ошибок.
Для разработчиков есть отдельное изменение в Messages API. Теперь API принимает системные записи внутри массива сообщений. Это позволяет менять инструкции Claude во время выполнения задачи без отдельного пользовательского хода и без сброса кэша промптов.
Например, агент работает в окружении, где меняются права доступа, лимит токенов, текущий этап задачи или контекст среды. Разработчик может обновить системную инструкцию внутри того же процесса. Для сложных агентных фреймворков это удобнее, чем каждый раз пересобирать весь диалог.
Anthropic показывает рост Opus 4.8 в задачах программирования, агентного использования компьютера, рассуждений и профессиональной работы. В публикациях с разбором релиза приводятся несколько заметных чисел из таблицы Anthropic.
На SWE-Bench Pro, тесте для агентного исправления кода, Opus 4.8 получила 69,2%. Opus 4.7 набрала 64,3%. На OSWorld-Verified, где оценивается работа с компьютерной средой, новая модель получила 83,4%. На Terminal-Bench 2.1 у Opus 4.8 указано 74,6%, и здесь она уступает GPT-5.5 в сравнительной таблице Anthropic.
В конце релиза Anthropic упомянула следующий уровень моделей — Mythos-class. Часть организаций уже тестирует Claude Mythos Preview для задач кибербезопасности в рамках закрытого Project Glasswing.
Компания подчёркивает, что такие модели требуют более сильных защитных механизмов перед широким выпуском. Модели, которые хорошо работают с кибербезопасностью, могут помогать в защите, анализе инцидентов и поиске уязвимостей, но тот же уровень навыков полезен для злоумышленников.
Anthropic обещает вывести возможности уровня Mythos для большего числа клиентов в ближайшие недели, но точной даты и публичной цены в релизе нет. Поэтому текущий коммерческий продукт для широкой аудитории — именно Opus 4.8.
Есть новость? Станьте автором.
Мы сотрудничаем с независимыми исследователями и специалистами по кибербезопасности. Отправьте нам новость или предложите статью на рассмотрение редакции.