Искусственный интеллект

Контент для трети новых сайтов в интернете уже делает ИИ

Маша Даровская
By Маша Даровская , IT-редактор и автор
Контент для трети новых сайтов в интернете уже делает ИИ
Обложка © Anonhaven

Доля новых сайтов с ИИ-текстами резко выросла после запуска ChatGPT. К середине 2025 года около 35% новых сайтов были классифицированы как полностью сгенерированные или созданные с участием искусственного интеллекта. До конца 2022 года таких сайтов в выборке почти не было.

В исследовании изучили страницы, опубликованные с 2022 по 2025 год, используя данные Wayback Machine — архива веб-страниц Internet Archive. Авторы искали не просто искали «типичные ИИ-фразы», а собрали репрезентативную выборку публичных страниц, а затем проверяли тексты несколькими детекторами: Binoculars, Desklib, DivEye и Pangram v3. После дополнительных тестов для основной оценки выбрали Pangram v3 — он показал лучшую устойчивость на их проверках.

Рост объясняется просто: ИИ резко снизил стоимость производства контента. Проверка показала два подтверждённых эффекта. Первый — снижение смыслового разнообразия: ИИ-сайты в среднем оказались семантически ближе друг к другу, чем сайты без признаков ИИ-текста. Второй — сдвиг в более позитивную тональность: у ИИ-страниц чаще встречался сглаженный, нейтрально-оптимистичный стиль.

Но исследователи не нашли статистически значимого подтверждения тому, что рост ИИ-текста уже ухудшил фактическую точность веба. Гипотеза про исчезновение индивидуального стиля тоже не подтвердилась на их данных.

Проблема в том, что однотипный ИИ-контент может забивать выдачу, конкурировать с оригинальными публикациями и усложнять поиск первоисточников. 404 Media раньше описывала такую механику как атаку на алгоритмы: многие ИИ-страницы пишутся не для людей, а для систем ранжирования и рекомендаций.

Отдельный риск — «самоедство» моделей. Если поисковики, парсеры и обучающие наборы всё чаще получают тексты, уже созданные ИИ, новые модели могут учиться на переработанном синтетическом материале. Авторы свежего исследования осторожнее: они фиксируют рост доли ИИ-текстов и снижение смыслового разнообразия, но не доказывают общий обвал качества контента в сети.

Есть новость? Станьте автором.

Мы сотрудничаем с независимыми исследователями и специалистами по кибербезопасности. Отправьте нам новость или предложите статью на рассмотрение редакции.

Вопросы по теме

ИИ создал 30% всего интернета?
Нет. Исследование говорит примерно о 35% новых сайтов к середине 2025 года, классифицированных как ИИ-сгенерированные или ИИ-дополненные.
Это точная цифра?
Это оценка по выборке и детектору. Авторы отмечают, что определение ИИ-текста остаётся сложной задачей.
Качество интернета уже доказанно ухудшилось?
Не полностью. Подтверждены снижение смыслового разнообразия и более позитивная тональность. Ухудшение фактической точности исследование не доказало.