Anthropic обвинила Alibaba и Qwen в дистилляции Claude: 28,8 млн запросов и почти 25 тыс. фейковых аккаунтов

Anthropic обвинила операторов, связанных с Alibaba и лабораторией Qwen, в масштабной попытке извлечь возможности Claude. Anthropic считает эту кампанию крупнейшей известной атакой такого типа против своих моделей.

История стала публичной после письма Anthropic американским законодателям. Документ датирован 10 июня 2026 года. В нём глава направления публичной политики Anthropic Сара Хек описывает почти 25 тыс. фейковых аккаунтов и 28,8 млн взаимодействий с Claude. Указанный период активности — с 22 апреля по 5 июня 2026 года.

Anthropic описывает схему: массовое использование Claude как «учителя» для обучения или улучшения другой модели. Такой подход называют дистилляцией. Модель-ученик получает много запросов и ответов от более сильной модели, затем разработчики пытаются перенести часть поведения, стиля решения задач и навыков в собственную систему.

В машинном обучении дистилляция сама по себе не запрещённый приём. Её используют легально: например, когда большую модель сжимают в более дешёвую и быструю. Но не тогда, когда для обучения берут ответы чужой коммерческой модели в обход правил доступа, лимитов, региональных ограничений и условий использования. Anthropic называет такой сценарий «враждебной дистилляцией».

По версии компании, операторов особенно интересовали программирование, агентные сценарии и долгие многошаговые задачи. Это совпадает с тем, что сейчас считается самым дорогим слоем в ИИ-моделях.

Отдельный акцент сделан на Qwen — семействе моделей Alibaba Cloud. Qwen активно развивается как открытая и коммерческая линейка, конкурирует с западными и китайскими моделями в кодинге, математике, мультимодальности и агентных сценариях. Прямого публичного доказательства, что конкретный релиз Qwen обучался на ответах Claude, сейчас нет. Доступная информация сводится к утверждениям Anthropic и публикациям медиа, получивших или пересказавших письмо компании.

Alibaba публично не дала развёрнутого ответа по обвинениям на момент подготовки материала. Это важная оговорка: обвинение не равно установленному факту. Anthropic утверждает, что атрибуция строилась на технических признаках, инфраструктуре и связях операторов с Alibaba/Qwen, но полный набор индикаторов в открытый доступ не выложен.

В феврале Anthropic уже рассказывала о промышленных кампаниях дистилляции, которые компания связывала с DeepSeek, Moonshot AI и MiniMax. Тогда речь шла о фейковых аккаунтах, прокси-сетях, распределении трафика и попытках маскировать массовые запросы под обычное использование. В одном из описанных случаев Anthropic писала о прокси-инфраструктуре с более чем 20 тыс. фейковых аккаунтов.

«С учётом конкурентной гонки, которая идёт между ведущими лабораториями, и той, что идёт между разными странами и открытыми и закрытыми технологиями, дистилляция данных и их кража при использовании модели через API являются одним из важнейших инцидентов длч американских компаний. Мы видим. что фактически многие модели обучаются на данных друг друга. Это не последнее обвинение в адрес китайских лабораторий, которые мы увидим в ближайшие месяцы».
— Евгений Кокуйкин, руководитель HiveTrace

Вам может понравиться: ИИ Anthropic за часы нашёл уязвимости в закрытых системах правительства США