蚂蚁上线万亿参数思考模型Ring-2.6-1T:PinchBench跑分87.60压GPT-5.4

火星财经快讯

05月09日 14:53
据 动察 Beating 监测,蚂蚁集团百灵大模型团队上线万亿参数旗舰思考模型 Ring-2.6-1T(激活参数 630 亿)。该模型专为复杂任务和生产环境设计,核心新增「动态思考强度」机制,系统可在认知深度、Token 成本和执行速度之间灵活平衡。 基于不同的计算负荷需求,模型提供 high 和 xhigh 两种运行模式。在主打多步执行和工具调用的 Agent 模式(high)下,其 PinchBench 跑分达 87.60,高于 GPT-5.4 xHigh 和 Gemini-3.1-Pro high,ClawEval 测试得分 63.82。在针对数学推理和科研的深度思考模式(xhigh)下,其 AIME 26 得分为 95.83,GPQA Diamond 得分 88.27。 官方表示,文本格式转换与数学竞赛对算力需求截然不同,设计该机制是为了降低 Token 开销,让模型能充当工具编排、编程和多轮交互等高频场景的默认底座。模型即日起联合 Novita 在 OpenRouter 平台提供为期一周的免费 API 试用(至 5 月 15 日),并将于近期开源权重。

查看原文 >
本内容旨在传递行业动态,不构成投资建议或承诺。
看更多快讯,下载火星财经 APP