История с блокировкой Claude Mythos 5 и Fable 5 получила новое объяснение — и оно звучит куда серьезнее первоначальной версии про «джейлбрейк» модели.
The Economist сообщил, что глава АНБ и Киберкомандования США генерал Джошуа Радд заявил сенаторам: модель Anthropic смогла проникнуть «почти во все засекреченные системы не за недели, а за часы». Фраза прозвучала в пересказе сенатора Марка Уорнера, заместителя председателя комитета Сената по разведке.
Это публичная цитата, пересказанная участником слушаний и попавшая в материал The Economist. За несколько дней до этого Anthropic отключила доступ к двум новым моделям — Claude Fable 5 и Claude Mythos 5. Компания объяснила это директивой правительства США: доступ к моделям должен быть закрыт для всех иностранных граждан, даже если они находятся внутри США, и даже если это сотрудники самой Anthropic.
На практике такое требование оказалось почти невыполнимым точечно. Cloud-сервис не может за минуты надежно разделить всех пользователей и сотрудников по гражданству, юрисдикции, статусу доступа и внутренним ролям. Поэтому Anthropic отключила модели глобально.
Claude Mythos 5 — более сильная модель Anthropic для сложных задач, включая автономную работу, программирование, анализ кода и кибербезопасность. Claude Fable 5 — связанная с ней модель с более жесткими ограничениями и защитными настройками.
Anthropic продвигала новые модели как заметный скачок в автономности. В релизе компания писала, что Fable 5 и Mythos 5 могут работать дольше без вмешательства человека, лучше справляются с программной инженерией, анализом знаний, визуальными задачами, памятью и научными сценариями.
Официальная версия Anthropic выглядит так: 12 июня компания получила директиву США об ограничении доступа к Fable 5 и Mythos 5 для иностранных граждан. В документе, как утверждает Anthropic, ссылались на национальную безопасность.
Anthropic писала, что правительство, вероятно, получило информацию о способе «джейлбрейка» модели. Компания утверждала, что речь шла об узком и неуниверсальном обходе, который позволял найти небольшое число уже известных и несложных уязвимостей. Anthropic также заявляла, что похожие результаты можно получить и у других публично доступных моделей.
The Verge писал, что сигнал тревоги мог прийти после тестов Amazon, крупного инвестора Anthropic. Исследователи Amazon, как сообщалось, проверяли Fable 5 и нашли способ заставить модель отвечать на рискованные вопросы по кибербезопасности. После этого администрация США потребовала срочно ограничить доступ.
Сама Anthropic спорит с таким масштабом оценки. Компания признает наличие правительственной директивы, но считает реакцию непропорциональной и указывает, что доказательства риска были в основном устными.
Есть новость? Станьте автором.
Мы сотрудничаем с независимыми исследователями и специалистами по кибербезопасности. Отправьте нам новость или предложите статью на рассмотрение редакции.