Anthropic представила Claude Security — специализированное решение для защиты от атак, которые создаются с помощью ИИ. Это ответ на рост числа автоматизированных эксплойтов, где генерация уязвимостей и их эксплуатация происходит почти без участия человека.
Новый продукт ориентирован на компании, которые работают с кодом, инфраструктурой и ИИ-агентами. Он интегрируется в процессы разработки и анализирует поведение моделей, выявляя подозрительные действия, попытки эксплуатации и аномалии.
Ключевая причина запуска — резкий скачок возможностей моделей. Claude Mythos уже демонстрирует способность находить и использовать zero-day-уязвимости в масштабах, недоступных человеку.
Внутренние тесты Anthropic показывают: современные модели могут не просто находить баги, а сразу формировать рабочие эксплойты.
Это меняет саму механику атак. Раньше цепочка выглядела так: поиск уязвимости → анализ → написание эксплойта → тестирование. Теперь всё это может выполняться одной системой в автоматическом режиме.
Claude Security пытается закрыть этот разрыв.
В решении реализовали:
— мониторинг действий AI-агентов
— контроль попыток выполнения опасных операций
— анализ цепочек запросов и поведения моделей
— обнаружение признаков prompt-инъекций и злоупотребления инструментами
Параллельно компания усиливает ограничения на доступ к наиболее мощным моделям. Проект Glasswing уже предполагает ограниченный доступ к Claude Mythos для узкого круга организаций.
Эксперты отмечают, что проблема выходит за пределы одной компании. ИИ сокращает время между обнаружением уязвимости и её эксплуатацией почти до нуля. В отрасли это уже называют ускоренной гонкой уязвимостей: кто быстрее — тот и выигрывает, независимо от того, атакующий это или защитник.
Есть новость? Станьте автором.
Мы сотрудничаем с независимыми исследователями и специалистами по кибербезопасности. Отправьте нам новость или предложите статью на рассмотрение редакции.