据动察 Beating 监测,英伟达于 6 月 4 日正式开源 5500 亿参数、激活 550 亿的旗舰大语言模型 Nemotron 3 Ultra,针对复杂规划、推理和工具调用等长程智能体任务进行了优化。在第三方基准平台 Artificial Analysis 的智能指数中,Nemotron 3 Ultra 得分 48 分,是目前美国本土性能最强的开源权重模型,仅次于月之暗面得分 54 分的 Kimi K2.6。 技术架构上,模型采用 Mamba-Transformer 混合专家架构 MoE,通过交替使用 Mamba-2 状态空间模型层与 Transformer 自注意力层,规避了超长上下文下 KV 缓存呈二次方增长的内存瓶颈,在极低内存开销下支持 100 万 token 的上下文窗口。相比同规模 dense 模型,混合架构在智能体任务下提升了 5 倍吞吐量,并降低了 30% 的推理成本。 生态配套上,英伟达同步发布了包含 NemoClaw 编排蓝图与 OpenShell 运行时的智能体工具包 Agent Toolkit。开源内容直接包含模型权重、数据集与训练配方。模型已在 Hugging Face、NVIDIA NIM 及 OpenRouter 上线,企业级 AI 搜索服务商 Glean 等已宣布接入,用作商业闭源大模型的替代方案。
查看原文 >