Искусственный интеллект и угрозы безопасности

Безопасность в эпоху нейросетей. Раздел посвящен тому, как искусственный интеллект меняет правила игры: дипфейки, использование ChatGPT хакерами, уязвимости в LLM-моделях и новые методы защиты с помощью машинного обучения.

Anthropic выпустила Claude Fable 5: публичную версию модели Mythos, доступ к которой ограничивали из-за киберрисков

Anthropic открыла доступ к Claude Fable 5 — новой модели класса Mythos. Компания называет её самой мощной моделью Claude из тех, что уже доступны широкой аудитории. Главная интрига релиза в происхождении модели: Fable 5 построена на том же уровне технологий, …

Читать далее

Claude Oceanus-v1-p всплыл в закрытых каналах: вокруг тестовой модели Anthropic уже появились прокси-продавцы

В сети обсуждают идентификатор claude-oceanus-v1-p, который мог появиться в ограниченных тестовых каналах Anthropic. Официального релиза нет, но история уже показывает риски утечек доступа, API-прокси и перепродажи закрытых моделей.

Читать далее

NVIDIA выпустила Nemotron 3 Ultra: 550 млрд параметров, контекст на миллион токенов и ставка на ИИ-агентов

NVIDIA опубликовала Nemotron 3 Ultra — старшую модель семейства Nemotron 3 с открытыми весами. Модель получила 550 млрд параметров, 55 млрд активных параметров, архитектуру Mamba-Transformer MoE, контекст до 1 млн токенов и ориентацию на агентные сценарии, программирование, исследовательские задачи и …

Читать далее

Операторы ищут способ вернуть россиянам доступ к ChatGPT, Claude и Gemini без привычного VPN

Российские операторы связи обсуждают с властями возможность вернуть прямой доступ к ChatGPT, Claude, Gemini и другим сервисам, которые не блокировал Роскомнадзор, но которые сами ограничили работу в России. Разбираем, что известно, как это может работать и какие риски остаются для …

Читать далее

ChatGPhish превращает пересказ страниц в фишинговую ловушку внутри ChatGPT

Исследователь Permiso Security описал ChatGPhish — технику, при которой вредоносная веб-страница через Markdown и непрямую prompt injection может заставить ChatGPT показать фишинговые ссылки, QR-коды и ложные предупреждения внутри привычного интерфейса.

Читать далее

Anthropic выпустила песочницу для Claude и секьюрити-плагин. Цель — не дать ИИ-агентам тащить код и секреты куда попало

Claude Code получил плагин, который ловит опасные паттерны до записи файлов. Claude теперь можно запускать ближе к периметру компании

Читать далее