英伟达通过自研AI工具(如NB-Cell、Prefix RL、Chip Nemo)大幅提升芯片设计效率,并以20亿美元战略入股Synopsys,将GPU深度嵌入EDA全流程,使先进芯片设计与制造高度依赖其硬件;国产GPU厂商则面临巨额亏损、先进制程EDA受制于人、工具链被英伟达生态绑定等多重困境。
作者:Ada,深潮 TechFlow
旧金山,圣何塞会议中心,GTC 现场。
英伟达首席科学家 Bill Dally 坐在台上,对面是谷歌的 Jeff Dean。两个人聊到一半,Dally 抛出一个数字:“此前移植一个包含约 2500 至 3000 个单元的标准单元库,需要 8 名工程师组成的团队耗时约 10 个月。”
他停了一下。
“现在仅需单卡 GPU,跑一个晚上。”
台下没有惊呼,因为听懂这句话的人都明白意味着什么。8 名工程师 10 个月的工作,被一颗自家产的 GPU 一夜之间吃掉了。而且 Dally 还补充道:跑出来的结果在面积、功耗、延迟这三个指标上,匹配甚至超过人类设计。
第二天就有新闻解读成“英伟达用 AI 设计 GPU”。
但这事的真相,远比新闻标题值得玩味的多。
英伟达内部跑的也不是黑箱,是几套磨了几年的工具链。
NB-Cell 是一个基于强化学习的程序,专干标准单元库迁移这种最苦的活。Prefix RL 旨在解决进位前瞻链中前瞻阶段的放置这一长期研究难题。Dally 表示,该系统生成的布局“是人类永远无法想到的”,与人类设计相比,关键指标提升了约 20% 到 30%。
再就是两个内部 LLM,Chip Nemo 和 Bug Nemo。英伟达将历史上每一颗 GPU 的 RTL 代码、架构文档、设计规格喂给这两个大模型。按照 Dally 的描述是,这相当于把英伟达从 G80 到 Blackwell 二十年的肌肉记忆蒸馏成了一个内部模型,新人进去就直接对接二十年功力的资深工程师。
那么“AI 可以设计 GPU”了吗?
恰恰相反。 Dally 的原话是:“我很希望有一天能直接说‘给我设计一颗新 GPU’,但我们离那一步还很远。”
英伟达没用 AI 设计出 GPU。但它做的另一件事让整个行业以后没它玩不转。
2025 年 12 月 1 日,英伟达以 20 亿美元入股 EDA 三巨头之一的 Synopsys。双方签了联合开发协议,把英伟达的加速计算栈嵌入 Synopsys 整条 EDA 工作流,Blackwell 和下一代 Rubin GPU 要跟 Synopsys.ai 做深度整合。
Synopsys 的地位需要解释一下。全球每一颗先进制程芯片,苹果 M 系列、AMD MI 系列、Google TPU,设计阶段几乎都跑在 Synopsys 或者 Cadence 的工具链上。这两家加上西门子 EDA,垄断了芯片设计的底层工具。你可以不用高通的芯片,可以不用台积电的产线,但你绑不开这三家的软件。
入股 Synopsys 之后三个月,英伟达把 Cadence、Siemens、Dassault 也拉了进来,宣布它们都在基于英伟达 GPU 开发 AI 驱动的芯片设计工具。
英伟达公布的基准测试数据摆出来挺吓人:Synopsys PrimeSim 在 Blackwell 上快 30 倍,Proteus 快 20 倍,Sentaurus 在 B200 上对比 CPU 加速 12 倍。联发科用 H100 把 Cadence Spectre 提速 6 倍。Astera Labs 用 Synopsys + NVIDIA 把芯片验证提速 3.5 倍。
有一个细节值得单独拎出来:Cadence 的 Millennium M2000 平台,标的是“专为 EDA 市场打造,独家基于 NVIDIA Blackwell”。
独家两个字最值得品。也就是说,EDA 工具以前跑在 CPU 上,Intel、AMD 都能玩。今后想用最快的 EDA,只能买英伟达的卡。
英伟达的飞轮,大多数人理解的版本是这样的:卖 GPU 给 AI 公司,AI 公司训练大模型,大模型证明 GPU 不可替代,更多人买 GPU。
这个飞轮已经够可怕了。但在它下面还有一层。
英伟达用自己的工具设计下一代 GPU,设计效率拉开代际差距,同时把整个行业的 EDA 工具链绑在自家硬件上。竞争对手想追,但连追的工具都得从英伟达的生态里租。
AMD 那份让股价大跌的财报背后藏的就是这层焦虑。即便英伟达和 Synopsys 表面上说“投资不附带任何采购英伟达硬件的义务”,市场也心知肚明:加速版 EDA 功能首发都在英伟达硬件上,AMD 和 Intel 只能依赖一条“为最大对手平台调优的路径”。
设想一下 AMD 的工程师以后想设计一颗对标 Blackwell 的芯片,他打开 Synopsys 的工具,这个工具在英伟达 GPU 上跑得最快。那么他要么忍受慢一倍的设计周期,要么买一堆英伟达的卡来设计要打败英伟达的芯片。
铲子还在卖。但卖法变了。
讲到这里,必须给一组让人清醒的数字。
英伟达 2025 财年净利润突破 700 亿美元的同一年,国产 GPU“四小龙”摩尔线程、沐曦、壁仞、燧原,挤在 IPO 的窗口前排队。
摩尔线程招股书显示,2022 年到 2024 年,三年累计净亏损 50 亿元,2025 年上半年再亏 2.71 亿元,截至 6 月 30 日累计未弥补亏损 14.78 亿元。公司管理层自己预计,最早 2027 年才能实现合并报表盈利。沐曦稍好一些,三年累计亏损超过 30 亿元。最惨的是壁仞,三年半亏损超过 63 亿元,2025 年上半年的收入只有 5890 万元,连摩尔线程同期 7.02 亿元的零头都不到。
再看研发投入的强度。摩尔线程 2022 年的研发费用占营收比例是 2422.51%,2024 年仍然高达 309.88%。一年研发花掉的钱,是收入的三倍多。这不是企业经营,这是输液续命,靠着一级市场和最近打开的科创板窗口持续输血。
工具层面更卡脖子。华大九天 2022 年 IPO 招股书显示工具仅部分支持 5nm 先进制程。概伦电子能覆盖 7nm/5nm/3nm 节点,但只做点工具,远谈不上全流程。
华大九天创始人刘伟平说得很坦诚:“国产 EDA 对先进工艺的支撑还存在明显不足,尤其是当下的 7nm、5nm、3nm 等。目前国产 EDA 可以做到 14nm 的水平,虽然掌握了 7nm 工艺技术,但 7nm 在与实际应用的深度融合上还需要全产业链的协同发力。”
也就是说,先进制程的全流程 EDA,国产基本不能用。国产 GPU 公司设计芯片用的还是 Synopsys 和 Cadence。2025 年特朗普一度宣布对所有关键软件实施出口管制,虽然没有实质落地,但 7nm 以下先进制程 EDA 工具至今处于严格管制状态。许可证什么时候被切,开关在别人手里。
资本市场的反应足够魔幻。沐曦上市当天,股价收报 829.9 元,单日上涨 692.95%。摩尔线程上市后股价一度升至 A 股第三,仅次于贵州茅台和寒武纪,有媒体按当时股价测算,其总市值约为 3595 亿元。
数字背后的真实生意是,一群仍在烧钱亏损、仍要依赖被管制的境外工具链才能继续设计芯片的公司,却在二级市场被定价成“国产英伟达”的接班人。
而这些公司用来设计芯片的那套工具,正在变成英伟达生态的一部分。英伟达和 Synopsys 那 20 亿美元的绑定,Cadence Millennium M2000“独家基于 NVIDIA Blackwell”的标签,让追赶这件事本身变成了一个悖论。
回到 GTC 那场对谈。
Dally 整场表现得很谦虚。“AI 还远远不能自己设计芯片”,这话英伟达已经讲了四五年了。但每年讲法在变。四年前是“AI 可以辅助设计”,三年前是“AI 可以自动化某些环节”,今年是“一晚上做完 8 个人 10 个月的活”。每年推一步,每年留一句“距离终极目标还很远”。三年后回头看,上一轮的“还很远”已经做到了,新的“还很远”被定义在了所有对手还够不着的位置。
英伟达过去十二个月做的事其实只有一件:把 AI 用在芯片产业链最值钱、护城河最深的那几个环节,然后把这些工具一层层卖给整个行业。
芯片设计的前端,被 Chip Nemo 这种内部 LLM 接管;设计中端的标准单元库迁移、版图优化,被 NB-Cell、Prefix RL 接管;整个 EDA 工具链,通过 Synopsys 的 20 亿美元和 Cadence 的“独家基于 Blackwell”绑在自家 GPU 上;制造端的光刻计算,被 cuLitho 接管,TSMC 已经在用。
从设计到制造,每一段英伟达都用 AI 重做了一遍。每一段最后都通向同一个终点:你想用最快的工具,就得买英伟达的卡。
对所有想造一颗能打败 Blackwell 的芯片的对手来说,最尴尬的事情已经发生了。设计这颗芯片要用的 EDA 工具,跑得最快的版本在英伟达的 GPU 上;制造这颗芯片要做的光刻计算,最快的算法库由英伟达提供;训练设计 AI 用的算力,还是英伟达的卡。
你要打败的那个人,正在向你出租打败它所需要的全部工具。租金按年付,合同每年涨价。