阿里云能否重写自己？

TechPulse

2026-05-20

热度：5780

阿里云正推进覆盖芯片、云平台、模型和推理的全栈Agent化重构，以适配AI原生时代下Agent自主调用云资源的新范式；通过自研真武系列AI芯片、千问大模型及'千问云'平台，构建低成本高效率的Token生产体系，并同步变革产品交互、调度逻辑、销售体系与考核指标。

摘要由 Mars AI 生成

本摘要由 Mars AI 模型生成，其生成内容的准确性、完整性还处于迭代更新阶段。

过去五个月，阿里云的MaaS收入增长了15倍，这只是阿里云重构自己的一个侧面。阿里云在峰会上宣布完成"芯片-云-模型-推理"全栈Agent化升级，同步推出全新AI产品官网"千问云"、搭载自研AI芯片真武M890的超节点服务器，以及最新旗舰模型Qwen3.7-Max。

用阿里云资深副总裁刘伟光的话说："我们正在建设中国最大的AI工厂。"工厂这个比喻暗示了一套完整的生产逻辑，片是原材料，云是车间，模型是机器，推理平台是流水线，最终产出的商品是Token。

而这次重构的本质，是把过去17年围绕"人使用云"搭建的整套体系，改造成"Agent消费Token"的新体系。

芯片这张牌，为什么现在打

阿里云过去很少在公开场合强调芯片。这次峰会，不仅发布了新一代训推一体AI芯片真武M890，还破天荒地公布了未来两年的芯片路线图，真武V900、真武J900两代产品逐年推进。

真武M890配备144GB显存，片间互联带宽800GB/s，性能是上一代真武810E的3倍，搭配自研的ICN Switch互联芯片，128张AI芯片可以组成一台机器，P2P时延压到150纳秒以内

但参数之外，更关键的信息是规模，真武系列累计出货56万片，已经进入电信、一汽、浦发银行等20多个行业的400多家客户。

刘伟光反复用谷歌做类比，谷歌TPU和Gemini的深度绑定，让谷歌在自家框架里跑出了最优的性价比。阿里云当然想走同样的路，他把竞争逻辑归结为一句话："如果未来拼的是每一块芯片都能跑出比竞争对手更多的高质量Token，那我们就胜利了。"

再加上倚天CPU、磐脉智能网卡、镇岳存储主控芯片，平头哥的芯片版图已经从单点延伸到了算力、网络、存储的完整覆盖。当推理需求指数级膨胀的时候，只有把芯片握在自己手里，才能控制住每个Token的边际成本。

道理不复杂。模型公司可以比拼参数，云厂商最终比的是谁的Token更便宜、更稳定、更快。芯片是这场成本战的起点。

云本身也得重写

芯片解决的是"跑得动"的问题，但Agent对云的需求远不止算力。

传统云产品的交互逻辑是给人设计的，打开控制台，看菜单，配参数，点按钮。这套东西对Agent来说完全不可用，Agent不看网页，不点按钮，它需要的是结构化的能力描述、标准化的调用协议和可预期的反馈。

阿里云CTO李飞飞用一组对比来说明问题：传统云的工作负载是稳态的，一台ECS开出来可能跑几个月甚至几年；但Agent的工作负载是"无规律弹性、短生命周期、瞬时起量即走"，一个Agent执行完任务，沙箱就销毁了，下一个请求可能几毫秒后就来，也可能几小时后才来。

为此，阿里云做了三件事。

第一，把云产品Skill化、MCP化和CLI化。简单说就是把每个云产品封装成Agent可以直接调用的标准化接口，像调函数一样调云。

第二，为Agent构建专属的运行环境——轻量沙箱、多Agent协同、跨任务记忆、数据流转通路。

第三，重建调度逻辑，从"资源调度"转向"任务调度"，因为当海量Agent同时并发的时候，传统的资源编排方式扛不住。

刘伟光表示，一些AI应用上线后，会自动在后台开通云资源——虚拟机、数据库实例、沙箱环境，全程不需要人介入，一个客户一天内自动开通的资源量，相当于过去人工操作两周。

"这已经等于说Agent在自己使用云了。"刘伟光给出了一个内部测算的换算关系：Token消耗可以按比例折算成GPU用量，而每一卡GPU的增长，大致带动一比一的CPU增长。也就是说，Token收入的增长不是在蚕食传统云收入，而是在拉动它，前提是云平台能够接得住Agent的工作负载。

因此，阿里云不是在原来的体系上加一层AI能力，而是从交互方式、调度逻辑、计费模型到产品形态全部推翻重来。

模型不是用来聊天的

全栈重构的第三层是模型。Qwen3.7-Max在Arena全球盲测总榜中排到了国产第一，超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，这次发布的重点，是阿里对模型能力方向的重新定义。

阿里巴巴通义大模型负责人周靖人表示，"过去我们追求模型'说得好'，现在要求模型'做得到'。"

以阿里云在芯片的实践来看，在训练时从未接触过的真武M890芯片上，Qwen3.7-Max仅凭一份任务说明，从零开始自主工作了35个小时，独立完成了一个生产级AI计算内核的编写和调优，最终性能比官方版本提升了10倍，整个过程没有人类干预，没有中间指导。

这说明了模型在Agent场景下的核心能力，长程自主执行，接过一个任务，自己拆解、自己规划、自己写代码、自己调试，连续干35个小时不停。

为了支撑这种级别的推理需求，百炼平台也做了对应升级，并池调度提升GPU利用率，上下文缓存消除重复计算，吞吐弹性调度应对并发波峰。

在生态上，百炼保持开放接入，除了千问模型矩阵，还上线了智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6等第三方模型。

刘伟光提到，"客户在实际使用中不会只用一个模型，是多模型组合。我们提供组合，客户在平台上找到最适合自己的搭配。"峰会现场，六家国内头部模型公司的高管集体站台，场面颇有"国内AI联盟"的意味。

近三个月内，千问旗舰模型连续迭代了3.5、3.6、3.7三个版本。这个发布节奏本身就在传递信号，模型能力的竞赛远没有结束，而阿里打算用自研芯片+自研模型的纵向整合来建立长期优势。

这场重构的真正赌注

回过头来看，阿里云这次全栈重构的底层逻辑简单纯粹，当AI收入的增长速度远超传统云业务，当Token有可能取代ECS成为最大的产品线，当Agent开始自动开通云资源而不再需要人类登录控制台，整套为人设计的技术体系就到了不得不改的时候。

但执行层面的难度是另一回事。刘伟光自己也承认，转型"说起来容易，做起来非常难"。过去销售团队跟客户的IT部门打交道，现在做MaaS要跟业务部门甚至CEO对话，

"你的对话能力、阅历，完全是另一个层次的要求"。阿里云已经在大客户上设立了专职的MaaS销售，与传统IaaS销售分开考核、独立作战。

考核指标也在变，不再只看调用量，而是看"高质量Token"，解决实际问题的Token，而不是灌水聊天的Token。三个核心指标：付费客户数的日增长、核心业务系统接入模型的数量、Agent自主完成任务闭环的效率。

这些组织和机制层面的调整，往往比技术发布更能说明一家公司的真实判断，阿里云要重建收入结构、客户关系和销售体系。刘伟光表示，"以前我们做云的时候，客户的IT预算是能算出来的，线下多少台服务器，搬上来大概多少钱，能看到题目。但做MaaS，这个题的答案你是不知道的，进去之后可能超乎你的想象。"

题目看不到了，答案也不确定，但阿里云还是决定把整套体系拆开重写，因为唯一确定的是，AI是比以往大上十倍甚至百倍的机会。

这大概就是这次峰会最值得关注的信息：不是哪款芯片多出算力，哪个模型排名第几，而是中国最大的云厂商，正在用一种接近创业公司的激进姿态，赌一个它认定会到来的未来。（本文作者 | 张帅，编辑 | 杨林）

本内容旨在传递行业动态，不构成投资建议或承诺。

为你推荐