黄仁勋AI战略解析:英伟达能否再创辉煌
硅基研究室 | 作者 | kiki谢浩
今年的英伟达GTC大会,似乎比去年少了些许狂热,但黄仁勋的AI叙事依旧引人瞩目。在美国加州圣何塞,英伟达的绿色身影依旧是科技圈最耀眼的符号。现场超过2万人齐聚一堂,线上更是成千上万的人通过直播观看黄仁勋的主题演讲。他的每一句话,英伟达的每一个动作,都成为人们判断AI时代走向的重要依据。然而,与预测未来相比,今年GTC上,黄仁勋更多是在重复和反驳——比如那句经典的“买得越多,省得越多,甚至比这更好——买得越多,赚得越多”,再比如“几乎全世界都误解了Scaling Law放缓”。这些重复的叙事,似乎并未带来预期的效果。对于英伟达GTC大会发布的一系列产品,华尔街的反应平平,英伟达盘后股价下跌了约4%。我们整理出这届GTC黄仁勋最想对市场说的三个关键真相。
1、53次token,捍卫Scaling Law的信仰
黄仁勋的演讲中,有一个反复出现的主题——tokens。他在自己的演讲里至少提到了53次。如此频繁地强调tokens,某种程度上是在告诉市场:Scaling Law并未终结,源源不断的tokens消耗将带来持续的算力需求,这是英伟达讲述一切增长的前提。他给出了一组数据:随着Agentic AI和推理能力的发展,目前所需的计算量是过去的至少100倍。给予黄仁勋信心的是英伟达GPU的下游应用场景——主要包括数据中心、汽车领域、机器人等,科技巨头、云厂商和算力租赁服务商都会大笔采购英伟达的先进芯片建设AI基建。黄仁勋曾这样形容:“英伟达不造芯片,英伟达造数据中心”。遵循这一认知,黄仁勋公布了一组数据:2024年,美国Top4云公司总计采购了130万颗Hopper架构GPU,到了2025年,这一数据飙升至360万颗Blackwell GPU,他预计数据中心建设的价值将达到1万亿美元。面向这些云厂商等企业端客户,英伟达主要出售的是包括AI服务器、高速交换机等AI算力集群服务,英伟达所提供的是系统和网络、硬件和软件等全方位方案。与此前的AI服务器GB200 NVL72一样,英伟达公布了新产品:Blackwell Ultra NVL72机柜,黄仁勋特别强调这是“AI推理专用机柜”。天风证券分析师郭明錤曾提到,影响英伟达AI服务器增长的一个重要因素是,它能否提供算力更强且平均token成本更低的Scale-up?至少从英伟达提供的数据来看,黄仁勋已想到了这一点:相比前一代产品GB200 NVL72,带宽是前代的两倍,内存速度是前代的1.5倍,同时由于机柜尺寸和电源规格相似,这对科技公司的数据中心升级而言,有着一定的性价比优势。不过黄仁勋没说的是,英伟达数据中心业务的暴涨年代已经过去了。单从财报看,英伟达数据中心业务已结束了六个季度以来连续保持的“三位数高增”,环比下降趋势也十分显著。郭明錤还提到,英伟达数据中心业务目前存在的问题是“量产的能见度不高”,英伟达需要更多具体列举数据中心部署GB200 NVL72的案例,以及客户转换到新产品的具体效益情况。
2、下一代芯片:黄式定律能否有效?
除去行业宏观层面,对Scaling Law的展望,过去的几个小时里,花费1万美金购票入场的技术信徒们,还在期待另一个问题的答案:“黄氏定律”能否延续。作为英伟达首席科学家所提出的,对后摩尔定律时代的重要补充,黄氏定律表明:GPU架构、软件的革新将推动AI性能实现每年翻倍。如果说Scaling Law关注的是“行业需不需要更多GPU”,那么黄氏定律所传达的内容则更为直观——行业需不需要英伟达。尽管从目前的市场趋势来看,Blackwell取得了远超于Hopper架构GPU的市场成绩,并直接带动了AI领域基建的新一轮繁荣,参考黄仁勋本人的说法:“Blackwell开始出货的一年内,你能看到人工智能基础设施建设出现了难以置信的增长。”但股价的下跌还是侧面传递出了市场的不满情绪。这一不满情绪的源头,很大程度上来自于年度算力“核弹”——Blackwell Ultra GB300的不佳表现。这颗被外界寄予厚望的芯片,并未能重现Blackwell架构横空出世时的惊艳感,反而更像是上一代芯片的内存“超大杯”版本。虽然黄仁勋并未对比两代Blackwell产品间的性能差异,但根据此前英伟达官方透露的信息显示,单个Ultra芯片将提供与Blackwell相同的20 petaflops的AI性能,HBM3e内存从192GB升级到了现在的288GB。似乎是为了补救现场用户的失望感,老黄直接趁势预告了明年上市的新一代Rubin架构GPU,并表示,新一代GPU的性能预计是Blackwell Ultra NVL72的3.3倍。但很显然,这种画饼行为并没有得到市场的认可。原因也很简单,想象一下库克在苹果发布会上掏出一部4TB版本的iPhone16告诉大家,这就是本届发布会的新品,顺便再吹一波iPhone18的性能——对比往期发布会上的遥遥领先,至少在今年,黄氏定律在硬件侧,短暂按下了暂停键。相比之下,软件侧的Nvidia Dynamo,反而成为了黄氏定律续命的关键。作为业内人士口中,英伟达“在推理领域构建的新CUDA”,Nvidia Dynamo绝对担得起发布会王炸的头衔。作为一个专为推理、训练和跨整个数据中心加速而构建的开源软件,Dynamo的性能数据相当出色:在NVIDIA Hoppe平台上,软件能够在同样的GPU前提下,将AI工厂的性能和收入提高一倍。而在GB200 NVL72机架集群上运行DeepSeek-R1模型时,生成的token数量更是进一步被提高了30多倍。从黄仁勋的演讲细节来看,他对这款产品的表现也非常满意,在介绍完相关性能后,他甚至轻松地和现场开启了玩笑:“这就是我以前为什么说,当Blackwell批量发货时,你不要把Hopper送人。”
3、从DeepSeek到大厂,黄仁勋的“中国朋友圈”
本届GTC,“中国元素”浓度也很高。长达两个小时的演讲里,句句不离推理的黄仁勋当然会提到DeepSeek,他将DeepSeek R1模型称为“卓越的创新”和“世界级的开源推理模型”。事实上,在ChatGPT尚未诞生的2022年,幻方AI就受邀在黄仁勋的GTC舞台上演讲。此次GTC,黄仁勋又秀了一次自己的“中国朋友圈”。在主题演讲的前一天,GTC特别举办了China AI Day-云与互联网在线中文专场,包括火山引擎、阿里云、百度、蚂蚁集团、京东、美团、快手、百川智能等中国企业分享了其在大语言模型、多模态大语言模型、数据科学和搜推广领域的前沿进展。大半个中国智驾圈也齐聚GTC,除此以外,据“硅基研究室”不完全统计,联想、比亚迪、文远知行、阿尔特、工业富联、九号公司、完美世界、银河通用等中国企业均相继宣布与英伟达的最新合作。尽管饱受地缘政治影响,但英伟达始终关注中国市场的一举一动。今年年初的例行中国行中,黄仁勋连续走访了多个中国城市,和中国合作伙伴同桌共饮。从科技历史来看,三次技术浪潮诞生了三家市值超三万亿美元的公司,他们是微软、苹果和英伟达,随着英伟达成为这个时代最伟大的企业之一,GTC大会已不仅仅只是黄仁勋的个人秀,而是整个AI圈的文化符号。人们对文化符号自带信仰和高预期,就像华尔街对英伟达的期待一样:人们的恐惧是,如果英伟达也不能讲出新故事了,那么下一个英伟达在哪里呢?