OpenAI представила GPT-5.6 — новое семейство моделей, где вместо одной универсальной версии теперь есть три уровня: Sol, Terra и Luna. Sol стал флагманом для самых сложных задач, Terra — сбалансированной моделью для повседневной работы, Luna — быстрым и недорогим вариантом для массовых запросов.
Главная техническая ставка сделана на GPT-5.6 Sol. Компания называет её своей самой сильной моделью и выделяет три направления: программирование, кибербезопасность и научные задачи, включая биологию. Отдельный акцент — длинные агентные сценарии, где модель должна не просто ответить на вопрос, а удерживать цель, планировать шаги, пользоваться инструментами и проверять результат.
Линейка состоит из трёх моделей.
Sol — старшая версия. Её продвигают для сложного кода, анализа уязвимостей, научных задач и длинных цепочек действий. Это модель для случаев, где важнее качество решения, а не минимальная цена запроса.
Terra — середина линейки. OpenAI описывает её как модель для эффективной повседневной работы. По заявлению компании, Terra сопоставима с GPT-5.5 по уровню возможностей, но стоит вдвое дешевле. Такой вариант нужен для продуктовых сценариев, где запросов много, а использовать флагман каждый раз слишком дорого.
Luna — самая быстрая и доступная модель. Её логично использовать для массовых задач: классификации, кратких ответов, первичной обработки данных, простых помощников, внутренних ботов и рутинных интеграций.
Что такое Ultra и зачем нужны субагенты
Самая интересная часть Sol — режим Ultra. OpenAI описывает его как режим, который выходит за рамки одного агента и использует субагентов для ускорения сложной работы.
Проще говоря, модель может разбить задачу на несколько направлений. Один субагент проверяет код, второй ищет ошибки в логике, третий анализирует документацию, четвёртый собирает итог. Это не магия и не гарантия правильного ответа, но архитектурно это уже другой класс работы. Модель меньше похожа на «одного умного собеседника» и больше — на координатора маленькой команды.
Рядом с Ultra появился режим max. Он даёт Sol больше времени на глубокое рассуждение. Такой режим нужен для задач, где быстрый ответ может быть хуже медленного: сложная отладка, миграция кода, анализ цепочки инцидента, проектирование архитектуры, поиск ошибки в большом наборе файлов.
Кибербезопасность стала самой чувствительной частью релиза. OpenAI прямо пишет, что GPT-5.6 Sol — её наиболее способная модель для задач безопасности. Она лучше работает с длинными задачами, связанными с исследованием уязвимостей и эксплуатацией, но компания подчёркивает защитный сценарий: поиск слабых мест, разработка исправлений, разбор кода, обучение и тестирование обороны.
На ExploitBench Sol сравнивают с Mythos Preview. Sol конкурентен с Mythos Preview и использует примерно треть выходных токенов. Это означает, что модель может решать сопоставимые задачи экономнее по объёму ответа
OpenAI также заявляет, что Sol лучше помогает искать и исправлять уязвимости, чем стабильно проводить атаки от начала до конца. В тестах на Chromium и Firefox модель находила ошибки и примитивы эксплуатации — строительные блоки эксплойта, но не смогла автономно собрать полноценную цепочку эксплуатации в заданных условиях.
У GPT-5.6 заявлен самый жёсткий набор защитных механизмов у OpenAI на момент релиза. В него входят отказы на запрещённые киберзапросы, проверки в реальном времени, анализ риска на уровне аккаунта, дифференцированный доступ, мониторинг, санкции за злоупотребления и постоянное тестирование.
Отдельно компания раскрыла масштаб автоматического редтиминга. Для поиска универсальных джейлбрейков — атак, которые работают не на одном конкретном запросе, а в разных контекстах, — было потрачено более 700 тыс. GPU-часов в пересчёте на A100. Это уже не ручная проверка пары десятков вредных промптов, а промышленная попытка ломать собственные фильтры заранее.
Человеческий редтиминг тоже остаётся. Внешние эксперты продолжают тестировать модель во время preview. Это полезно, потому что автоматические проверки хорошо масштабируются, но люди всё ещё лучше придумывают странные обходные сценарии, социальные манипуляции и цепочки запросов, которые не выглядят опасными по отдельности.
Минус такой схемы для легитимных пользователей очевиден: защитные фильтры могут ошибаться. OpenAI заранее предупреждает, что часть нормальной работы в двойных областях — особенно в кибербезопасности — может блокироваться или проходить медленнее из-за дополнительной проверки. Доступ пока ограничен
GPT-5.6 не стала обычным массовым релизом в ChatGPT. На этапе предпросмотра модели доступны выбранным доверенным партнёрам и организациям через API и Codex. OpenAI обещает расширить доступ для ChatGPT, Codex и API позже.
Ограничение связано с предварительным согласованием запуска с властями США. Компания подчёркивает, что не хочет превращать такой порядок в постоянную норму, потому что это замедляет доступ для разработчиков, предприятий, защитников и международных партнёров. Но для GPT-5.6 выбран именно поэтапный запуск.
Сколько это стоит
OpenAI раскрыла цены за 1 млн токенов. Sol стоит $5 за входные токены и $30 за выходные. Terra — $2,50 за вход и $15 за выход. Luna — $1 за вход и $6 за выход.
Для корпоративного внедрения цена выходных токенов особенно заметна: агентные задачи, код-ревью, отчёты по уязвимостям и длинные рассуждения могут генерировать много текста. Если модель решает задачу с меньшим количеством токенов, итоговая стоимость может оказаться ниже даже при высокой цене за миллион.
OpenAI также добавляет более предсказуемое кэширование промптов: явные точки разрыва кэша и минимальную жизнь кэша 30 минут. Для продуктов с повторяющимися системными инструкциями, документацией или контекстом проекта это может сильно снизить стоимость запросов. Запись в кэш будет стоить дороже обычного входа, чтение из кэша сохранит скидку.
Ещё одна заявленная деталь — запуск GPT-5.6 Sol на Cerebras в июле со скоростью до 750 токенов в секунду. Доступ сначала тоже ограничат. Если такие скорости подтвердятся в реальных сценариях, это может быть важным для интерактивных агентов, где задержка ломает пользовательский опыт.
Есть новость? Станьте автором.
Мы сотрудничаем с независимыми исследователями и специалистами по кибербезопасности. Отправьте нам новость или предложите статью на рассмотрение редакции.
Читайте также
OpenRouter отключает российские аккаунты: пользователям дают время потратить баланс или запросить возврат
Claude готовит проверки возраста и личности: часть пользователей может получить запрос на документ и селфи