阿里云能否重写自己?
TechPulse
2026-05-20
热度5780

阿里云正推进覆盖芯片、云平台、模型和推理的全栈Agent化重构,以适配AI原生时代下Agent自主调用云资源的新范式;通过自研真武系列AI芯片、千问大模型及'千问云'平台,构建低成本高效率的Token生产体系,并同步变革产品交互、调度逻辑、销售体系与考核指标。

摘要由 Mars AI 生成
本摘要由 Mars AI 模型生成,其生成内容的准确性、完整性还处于迭代更新阶段。

过去五个月,阿里云的MaaS收入增长了15倍,这只是阿里云重构自己的一个侧面。阿里云在峰会上宣布完成"芯片-云-模型-推理"全栈Agent化升级,同步推出全新AI产品官网"千问云"、搭载自研AI芯片真武M890的超节点服务器,以及最新旗舰模型Qwen3.7-Max。

用阿里云资深副总裁刘伟光的话说:"我们正在建设中国最大的AI工厂。"工厂这个比喻暗示了一套完整的生产逻辑,片是原材料,云是车间,模型是机器,推理平台是流水线,最终产出的商品是Token。

而这次重构的本质,是把过去17年围绕"人使用云"搭建的整套体系,改造成"Agent消费Token"的新体系。

芯片这张牌,为什么现在打

阿里云过去很少在公开场合强调芯片。这次峰会,不仅发布了新一代训推一体AI芯片真武M890,还破天荒地公布了未来两年的芯片路线图,真武V900、真武J900两代产品逐年推进。

真武M890配备144GB显存,片间互联带宽800GB/s,性能是上一代真武810E的3倍,搭配自研的ICN Switch互联芯片,128张AI芯片可以组成一台机器,P2P时延压到150纳秒以内

但参数之外,更关键的信息是规模,真武系列累计出货56万片,已经进入电信、一汽、浦发银行等20多个行业的400多家客户。

刘伟光反复用谷歌做类比,谷歌TPU和Gemini的深度绑定,让谷歌在自家框架里跑出了最优的性价比。阿里云当然想走同样的路,他把竞争逻辑归结为一句话:"如果未来拼的是每一块芯片都能跑出比竞争对手更多的高质量Token,那我们就胜利了。"

再加上倚天CPU、磐脉智能网卡、镇岳存储主控芯片,平头哥的芯片版图已经从单点延伸到了算力、网络、存储的完整覆盖。当推理需求指数级膨胀的时候,只有把芯片握在自己手里,才能控制住每个Token的边际成本。

道理不复杂。模型公司可以比拼参数,云厂商最终比的是谁的Token更便宜、更稳定、更快。芯片是这场成本战的起点。

云本身也得重写

芯片解决的是"跑得动"的问题,但Agent对云的需求远不止算力。

传统云产品的交互逻辑是给人设计的,打开控制台,看菜单,配参数,点按钮。这套东西对Agent来说完全不可用,Agent不看网页,不点按钮,它需要的是结构化的能力描述、标准化的调用协议和可预期的反馈。

阿里云CTO李飞飞用一组对比来说明问题:传统云的工作负载是稳态的,一台ECS开出来可能跑几个月甚至几年;但Agent的工作负载是"无规律弹性、短生命周期、瞬时起量即走",一个Agent执行完任务,沙箱就销毁了,下一个请求可能几毫秒后就来,也可能几小时后才来。

为此,阿里云做了三件事。

第一,把云产品Skill化、MCP化和CLI化。简单说就是把每个云产品封装成Agent可以直接调用的标准化接口,像调函数一样调云。

第二,为Agent构建专属的运行环境——轻量沙箱、多Agent协同、跨任务记忆、数据流转通路。

第三,重建调度逻辑,从"资源调度"转向"任务调度",因为当海量Agent同时并发的时候,传统的资源编排方式扛不住。

刘伟光表示,一些AI应用上线后,会自动在后台开通云资源——虚拟机、数据库实例、沙箱环境,全程不需要人介入,一个客户一天内自动开通的资源量,相当于过去人工操作两周。

"这已经等于说Agent在自己使用云了。"刘伟光给出了一个内部测算的换算关系:Token消耗可以按比例折算成GPU用量,而每一卡GPU的增长,大致带动一比一的CPU增长。也就是说,Token收入的增长不是在蚕食传统云收入,而是在拉动它,前提是云平台能够接得住Agent的工作负载。

因此,阿里云不是在原来的体系上加一层AI能力,而是从交互方式、调度逻辑、计费模型到产品形态全部推翻重来。

模型不是用来聊天的

全栈重构的第三层是模型。Qwen3.7-Max在Arena全球盲测总榜中排到了国产第一,超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,这次发布的重点,是阿里对模型能力方向的重新定义。

阿里巴巴通义大模型负责人周靖人表示,"过去我们追求模型'说得好',现在要求模型'做得到'。"

以阿里云在芯片的实践来看,在训练时从未接触过的真武M890芯片上,Qwen3.7-Max仅凭一份任务说明,从零开始自主工作了35个小时,独立完成了一个生产级AI计算内核的编写和调优,最终性能比官方版本提升了10倍,整个过程没有人类干预,没有中间指导。

这说明了模型在Agent场景下的核心能力,长程自主执行,接过一个任务,自己拆解、自己规划、自己写代码、自己调试,连续干35个小时不停。

为了支撑这种级别的推理需求,百炼平台也做了对应升级,并池调度提升GPU利用率,上下文缓存消除重复计算,吞吐弹性调度应对并发波峰。

在生态上,百炼保持开放接入,除了千问模型矩阵,还上线了智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6等第三方模型。

刘伟光提到,"客户在实际使用中不会只用一个模型,是多模型组合。我们提供组合,客户在平台上找到最适合自己的搭配。"峰会现场,六家国内头部模型公司的高管集体站台,场面颇有"国内AI联盟"的意味。

近三个月内,千问旗舰模型连续迭代了3.5、3.6、3.7三个版本。这个发布节奏本身就在传递信号,模型能力的竞赛远没有结束,而阿里打算用自研芯片+自研模型的纵向整合来建立长期优势。

这场重构的真正赌注

回过头来看,阿里云这次全栈重构的底层逻辑简单纯粹,当AI收入的增长速度远超传统云业务,当Token有可能取代ECS成为最大的产品线,当Agent开始自动开通云资源而不再需要人类登录控制台,整套为人设计的技术体系就到了不得不改的时候。

但执行层面的难度是另一回事。刘伟光自己也承认,转型"说起来容易,做起来非常难"。过去销售团队跟客户的IT部门打交道,现在做MaaS要跟业务部门甚至CEO对话,

"你的对话能力、阅历,完全是另一个层次的要求"。阿里云已经在大客户上设立了专职的MaaS销售,与传统IaaS销售分开考核、独立作战。

考核指标也在变,不再只看调用量,而是看"高质量Token",解决实际问题的Token,而不是灌水聊天的Token。三个核心指标:付费客户数的日增长、核心业务系统接入模型的数量、Agent自主完成任务闭环的效率。

这些组织和机制层面的调整,往往比技术发布更能说明一家公司的真实判断,阿里云要重建收入结构、客户关系和销售体系。刘伟光表示,"以前我们做云的时候,客户的IT预算是能算出来的,线下多少台服务器,搬上来大概多少钱,能看到题目。但做MaaS,这个题的答案你是不知道的,进去之后可能超乎你的想象。"

题目看不到了,答案也不确定,但阿里云还是决定把整套体系拆开重写,因为唯一确定的是,AI是比以往大上十倍甚至百倍的机会。

这大概就是这次峰会最值得关注的信息:不是哪款芯片多出算力,哪个模型排名第几,而是中国最大的云厂商,正在用一种接近创业公司的激进姿态,赌一个它认定会到来的未来。(本文作者 | 张帅,编辑 | 杨林)

本内容旨在传递行业动态,不构成投资建议或承诺。
为你推荐

商务合作:TG:@Lottie96