NVIDIA выпустила Nemotron 3 Ultra: 550 млрд параметров, контекст на миллион токенов и ставка на ИИ-агентов
NVIDIA опубликовала Nemotron 3 Ultra — старшую модель семейства Nemotron 3 с открытыми весами. Модель получила 550 млрд параметров, 55 млрд активных параметров, архитектуру Mamba-Transformer MoE, контекст до 1 млн токенов и ориентацию на агентные сценарии, программирование, исследовательские задачи и …
Читать далее →