英伟达开始卖造铲子的方法了

深潮TechFlow

2026-04-15

热度：4149

英伟达通过自研AI工具（如NB-Cell、Prefix RL、Chip Nemo）大幅提升芯片设计效率，并以20亿美元战略入股Synopsys，将GPU深度嵌入EDA全流程，使先进芯片设计与制造高度依赖其硬件；国产GPU厂商则面临巨额亏损、先进制程EDA受制于人、工具链被英伟达生态绑定等多重困境。

摘要由 Mars AI 生成

本摘要由 Mars AI 模型生成，其生成内容的准确性、完整性还处于迭代更新阶段。

作者：Ada，深潮 TechFlow

旧金山，圣何塞会议中心，GTC 现场。

英伟达首席科学家 Bill Dally 坐在台上，对面是谷歌的 Jeff Dean。两个人聊到一半，Dally 抛出一个数字：“此前移植一个包含约 2500 至 3000 个单元的标准单元库，需要 8 名工程师组成的团队耗时约 10 个月。”

他停了一下。

“现在仅需单卡 GPU，跑一个晚上。”

台下没有惊呼，因为听懂这句话的人都明白意味着什么。8 名工程师 10 个月的工作，被一颗自家产的 GPU 一夜之间吃掉了。而且 Dally 还补充道：跑出来的结果在面积、功耗、延迟这三个指标上，匹配甚至超过人类设计。

第二天就有新闻解读成“英伟达用 AI 设计 GPU”。

但这事的真相，远比新闻标题值得玩味的多。

英伟达内部在跑什么？

英伟达内部跑的也不是黑箱，是几套磨了几年的工具链。

NB-Cell 是一个基于强化学习的程序，专干标准单元库迁移这种最苦的活。Prefix RL 旨在解决进位前瞻链中前瞻阶段的放置这一长期研究难题。Dally 表示，该系统生成的布局“是人类永远无法想到的”，与人类设计相比，关键指标提升了约 20% 到 30%。

再就是两个内部 LLM，Chip Nemo 和 Bug Nemo。英伟达将历史上每一颗 GPU 的 RTL 代码、架构文档、设计规格喂给这两个大模型。按照 Dally 的描述是，这相当于把英伟达从 G80 到 Blackwell 二十年的肌肉记忆蒸馏成了一个内部模型，新人进去就直接对接二十年功力的资深工程师。

那么“AI 可以设计 GPU”了吗？

恰恰相反。 Dally 的原话是：“我很希望有一天能直接说‘给我设计一颗新 GPU’，但我们离那一步还很远。”

英伟达没用 AI 设计出 GPU。但它做的另一件事让整个行业以后没它玩不转。

20 亿美元买进 EDA 腹地

2025 年 12 月 1 日，英伟达以 20 亿美元入股 EDA 三巨头之一的 Synopsys。双方签了联合开发协议，把英伟达的加速计算栈嵌入 Synopsys 整条 EDA 工作流，Blackwell 和下一代 Rubin GPU 要跟 Synopsys.ai 做深度整合。

Synopsys 的地位需要解释一下。全球每一颗先进制程芯片，苹果 M 系列、AMD MI 系列、Google TPU，设计阶段几乎都跑在 Synopsys 或者 Cadence 的工具链上。这两家加上西门子 EDA，垄断了芯片设计的底层工具。你可以不用高通的芯片，可以不用台积电的产线，但你绑不开这三家的软件。

入股 Synopsys 之后三个月，英伟达把 Cadence、Siemens、Dassault 也拉了进来，宣布它们都在基于英伟达 GPU 开发 AI 驱动的芯片设计工具。

英伟达公布的基准测试数据摆出来挺吓人：Synopsys PrimeSim 在 Blackwell 上快 30 倍，Proteus 快 20 倍，Sentaurus 在 B200 上对比 CPU 加速 12 倍。联发科用 H100 把 Cadence Spectre 提速 6 倍。Astera Labs 用 Synopsys + NVIDIA 把芯片验证提速 3.5 倍。

有一个细节值得单独拎出来：Cadence 的 Millennium M2000 平台，标的是“专为 EDA 市场打造，独家基于 NVIDIA Blackwell”。

独家两个字最值得品。也就是说，EDA 工具以前跑在 CPU 上，Intel、AMD 都能玩。今后想用最快的 EDA，只能买英伟达的卡。

飞轮的真实形状

英伟达的飞轮，大多数人理解的版本是这样的：卖 GPU 给 AI 公司，AI 公司训练大模型，大模型证明 GPU 不可替代，更多人买 GPU。

这个飞轮已经够可怕了。但在它下面还有一层。

英伟达用自己的工具设计下一代 GPU，设计效率拉开代际差距，同时把整个行业的 EDA 工具链绑在自家硬件上。竞争对手想追，但连追的工具都得从英伟达的生态里租。

AMD 那份让股价大跌的财报背后藏的就是这层焦虑。即便英伟达和 Synopsys 表面上说“投资不附带任何采购英伟达硬件的义务”，市场也心知肚明：加速版 EDA 功能首发都在英伟达硬件上，AMD 和 Intel 只能依赖一条“为最大对手平台调优的路径”。

设想一下 AMD 的工程师以后想设计一颗对标 Blackwell 的芯片，他打开 Synopsys 的工具，这个工具在英伟达 GPU 上跑得最快。那么他要么忍受慢一倍的设计周期，要么买一堆英伟达的卡来设计要打败英伟达的芯片。

铲子还在卖。但卖法变了。

国产 GPU 的真实处境

讲到这里，必须给一组让人清醒的数字。

英伟达 2025 财年净利润突破 700 亿美元的同一年，国产 GPU“四小龙”摩尔线程、沐曦、壁仞、燧原，挤在 IPO 的窗口前排队。

摩尔线程招股书显示，2022 年到 2024 年，三年累计净亏损 50 亿元，2025 年上半年再亏 2.71 亿元，截至 6 月 30 日累计未弥补亏损 14.78 亿元。公司管理层自己预计，最早 2027 年才能实现合并报表盈利。沐曦稍好一些，三年累计亏损超过 30 亿元。最惨的是壁仞，三年半亏损超过 63 亿元，2025 年上半年的收入只有 5890 万元，连摩尔线程同期 7.02 亿元的零头都不到。

再看研发投入的强度。摩尔线程 2022 年的研发费用占营收比例是 2422.51%，2024 年仍然高达 309.88%。一年研发花掉的钱，是收入的三倍多。这不是企业经营，这是输液续命，靠着一级市场和最近打开的科创板窗口持续输血。

工具层面更卡脖子。华大九天 2022 年 IPO 招股书显示工具仅部分支持 5nm 先进制程。概伦电子能覆盖 7nm/5nm/3nm 节点，但只做点工具，远谈不上全流程。

华大九天创始人刘伟平说得很坦诚：“国产 EDA 对先进工艺的支撑还存在明显不足，尤其是当下的 7nm、5nm、3nm 等。目前国产 EDA 可以做到 14nm 的水平，虽然掌握了 7nm 工艺技术，但 7nm 在与实际应用的深度融合上还需要全产业链的协同发力。”

也就是说，先进制程的全流程 EDA，国产基本不能用。国产 GPU 公司设计芯片用的还是 Synopsys 和 Cadence。2025 年特朗普一度宣布对所有关键软件实施出口管制，虽然没有实质落地，但 7nm 以下先进制程 EDA 工具至今处于严格管制状态。许可证什么时候被切，开关在别人手里。

资本市场的反应足够魔幻。沐曦上市当天，股价收报 829.9 元，单日上涨 692.95%。摩尔线程上市后股价一度升至 A 股第三，仅次于贵州茅台和寒武纪，有媒体按当时股价测算，其总市值约为 3595 亿元。

数字背后的真实生意是，一群仍在烧钱亏损、仍要依赖被管制的境外工具链才能继续设计芯片的公司，却在二级市场被定价成“国产英伟达”的接班人。

而这些公司用来设计芯片的那套工具，正在变成英伟达生态的一部分。英伟达和 Synopsys 那 20 亿美元的绑定，Cadence Millennium M2000“独家基于 NVIDIA Blackwell”的标签，让追赶这件事本身变成了一个悖论。

一条从设计到制造的完整链

回到 GTC 那场对谈。

Dally 整场表现得很谦虚。“AI 还远远不能自己设计芯片”，这话英伟达已经讲了四五年了。但每年讲法在变。四年前是“AI 可以辅助设计”，三年前是“AI 可以自动化某些环节”，今年是“一晚上做完 8 个人 10 个月的活”。每年推一步，每年留一句“距离终极目标还很远”。三年后回头看，上一轮的“还很远”已经做到了，新的“还很远”被定义在了所有对手还够不着的位置。

英伟达过去十二个月做的事其实只有一件：把 AI 用在芯片产业链最值钱、护城河最深的那几个环节，然后把这些工具一层层卖给整个行业。

芯片设计的前端，被 Chip Nemo 这种内部 LLM 接管；设计中端的标准单元库迁移、版图优化，被 NB-Cell、Prefix RL 接管；整个 EDA 工具链，通过 Synopsys 的 20 亿美元和 Cadence 的“独家基于 Blackwell”绑在自家 GPU 上；制造端的光刻计算，被 cuLitho 接管，TSMC 已经在用。

从设计到制造，每一段英伟达都用 AI 重做了一遍。每一段最后都通向同一个终点：你想用最快的工具，就得买英伟达的卡。

对所有想造一颗能打败 Blackwell 的芯片的对手来说，最尴尬的事情已经发生了。设计这颗芯片要用的 EDA 工具，跑得最快的版本在英伟达的 GPU 上；制造这颗芯片要做的光刻计算，最快的算法库由英伟达提供；训练设计 AI 用的算力，还是英伟达的卡。

你要打败的那个人，正在向你出租打败它所需要的全部工具。租金按年付，合同每年涨价。

本内容旨在传递行业动态，不构成投资建议或承诺。

为你推荐

商务合作：TG：@Lottie96