英伟达正式开源旗舰级550B模型Nemotron 3 Ultra：首创Mamba-Transformer混合MoE架构，专为长程智能体而生

火星财经快讯

06月04日 23:47

据动察 Beating 监测，英伟达于 6 月 4 日正式开源 5500 亿参数、激活 550 亿的旗舰大语言模型 Nemotron 3 Ultra，针对复杂规划、推理和工具调用等长程智能体任务进行了优化。在第三方基准平台 Artificial Analysis 的智能指数中，Nemotron 3 Ultra 得分 48 分，是目前美国本土性能最强的开源权重模型，仅次于月之暗面得分 54 分的 Kimi K2.6。技术架构上，模型采用 Mamba-Transformer 混合专家架构 MoE，通过交替使用 Mamba-2 状态空间模型层与 Transformer 自注意力层，规避了超长上下文下 KV 缓存呈二次方增长的内存瓶颈，在极低内存开销下支持 100 万 token 的上下文窗口。相比同规模 dense 模型，混合架构在智能体任务下提升了 5 倍吞吐量，并降低了 30% 的推理成本。生态配套上，英伟达同步发布了包含 NemoClaw 编排蓝图与 OpenShell 运行时的智能体工具包 Agent Toolkit。开源内容直接包含模型权重、数据集与训练配方。模型已在 Hugging Face、NVIDIA NIM 及 OpenRouter 上线，企业级 AI 搜索服务商 Glean 等已宣布接入，用作商业闭源大模型的替代方案。

查看原文 >

本内容旨在传递行业动态，不构成投资建议或承诺。

7x24 快讯

06月04日 23:53

美国司法部联合科技巨头冻结 380 万美元涉诈加密资产，打击东南亚跨国犯罪

06月04日 23:47

英伟达正式开源旗舰级550B模型Nemotron 3 Ultra：首创Mamba-Transformer混合MoE架构，专为长程智能体而生

06月04日 23:41

参议员 Lummis 领衔共和党要求放松巴塞尔对加密资产资本惩罚

06月04日 23:05

国际货币基金组织预计美联储 2% 通胀目标回归时间推迟至 2027 年底

06月04日 22:58

高盛：预计到2030年，SpaceX AI收入将增长100倍

06月04日 22:27

ARK Invest：仅Starlink业务就足以支撑SpaceX近2万亿美元IPO估值

看更多快讯，下载火星财经 APP