新闻资讯

一文看懂2025GTC:AI推理时代到来,英伟达推出“算力核弹”

界面新闻记者 | 李彪

界面新闻编辑 | 文姝琪

美国时间3月18日,英伟达在美国圣何塞举办GTC(GPU技术大会)。作为全球最受关注的科技巨头,今年GTC吸引约2.5万人线下参加,另有30万人通过线上方式收看直播。

英伟达CEO黄仁勋在主题演讲开场说道,“因为AI技术爆发,GTC大会的规模每年都在扩大。去年他们说GTC是AI行业的‘伍德斯托克摇滚音乐节’。今年我们搬进了体育场,GTC已经成AI行业的‘超级碗’”。

而在此次GTC大会上,英伟达不仅发布了Blackwell GPU、硅光交换机、机器人模型等一系列新产品。黄仁勋还在演讲中反复传递出一个信号:随着AI行业在模型训练上的整体需求放缓,再加上DeepSeek在模型推理上所做创新,AI推理时代即将到来。

演讲结束后,英伟达股价收盘跌超3.4%,报115.43美元/股,盘后继续下跌0.56%。

Blackwell  Ultra GPU:专为AI推理打造的“算力核弹”

作为GTC的重头戏,黄仁勋在演讲中宣布推出数据中心AI GPU的新一代产品——NVIDIA Blackwell Ultra GPU。

此前市场传言英伟达去年年底计划将Blackwell Ultra改名为B300 ,但根据现场公布的结果,官方保留了原始命名。Blackwell Ultra GPU相比于上一代B200GPU性能提升了50%,约为15P FLOPS(基于低精度的四位浮点数格式FP4标准),内存上则搭载了业内更先进的HBM3E,从192GB升级到了288GB。

图源:英伟达

基于Blackwell Ultra,英伟达面向云计算厂商等大型企业客户客户提供两款系统集成产品:Blackwell Ultra NVL72机架式解决方案与NVIDIA HGX Blackwell Ultra NVL16系统。

其中,Blackwell Ultra NVL72是在一个数据中心机架(一台服务器搭载8个GPU,一个机架可以容纳多台服务器)中连接了72个Blackwell Ultra GPU以及36个英伟达基于ARM架构设计的Grace CPU。据与上一代B200GPU的同类产品相比,Blackwell Ultra NVL72在AI算力性能上提升超过了50%。HGX Blackwell Ultra NV16则是运用NVLink高速互联 *** 连接8个Blackwell Ultra GPU的服务器系统产品。

与A100、H100等多款主要用在AI模型预训练的产品不同,英伟达此次明确定位Blackwell Ultra“专为AI模型推理打造”(AI-Reasoning),同时兼顾"训练和多场景AI应用的高效性"。Blackwell Ultra NVL72和HGX Blackwell Ultra NVL16(8GPU)两款系统产品也在提升计算能力和内存容量的同时,专为复杂AI推理任务做了优化。以HGX Blackwell Ultra NVL16为例,相较于上一代Hopper架构,这款新品在大模型推理速度上提升了11倍。

此前在DeepSeek用极低的算力成本完成模型开发后,外界就曾担忧市场对英伟达算力芯片产品的旺盛需求是否会放缓,英伟达官方及黄仁勋就曾在多个场合表示,相比于AI厂商先前将大量算力投资用于AI模型训练上,DeepSeek主要在模型推理运用了创新技术,而AI推理依然需要大量英伟达GPU和高性能 *** 。

在AI行业的“Scaling Law”法则(模型规模越大,模型越智能)在预训练环节放缓后,推理环节将催生更大规模的算力需求,因此“DeepSeek的出现反而证明市场需要更多AI芯片”。

据黄仁勋介绍,Blackwell系列,目前已经全面投产。“产量惊人,客户需求惊人,因为人工智能出现了一个拐点,由于推理人工智能以及推理人工智能系统和智能体系统的训练,人工智能领域必须完成的计算量大大增加。”

按照英伟达“一年一更新”发布节奏,黄仁勋演讲中预告了下一代Rubin架构两款产品Rubin GPU、Rubin Ultra GPU的性能信息。

Rubin GPU算力性能将在FP4标准下达到50P Flops,约是Blackwell Ultra GPU的3.3倍,Rubin Ultra GPU则在相同标准下为100P。两款新架构产品届时也将用上HBM4、HBM4E先进AI内存。搭载Rubin GPU的Vera Rubin NVL144(连接144个GPU)将于 2026 年下半年推出,Rubin Ultra GPU的Rubin Ultra NVL576(连接576个GPU)将于2027年下半年推出。

继Rubin架构之后,黄仁勋现场公布下一代GPU架构的命名为“Feynman”,取自著名物理学家理查德・费曼(Richard Feynman),Feynman架构产品将于2028年发布。

智能体和机器人时代,AI将需要更多芯片

与去年GTC密集发布各种新产品的节奏不同,黄仁勋今年在公布新品前,在现场花了更多时间科普“Agentic AI”的概念,以及AI推理带来的巨大改变。

在现场展示的AI技术发展路线图中,黄仁勋按照“Generative AI(生成式AI)、Agentic AI(智能体)、Physical AI(具身AI)”三个阶段的进化路线,将Agentic AI描述为AI技术发展的中间态。

相比于生成式AI的主要应用——语言大模型与聊天机器人——主要聚焦于生成文本、图像内容,Agentic AI更进一步,能够理解任务、进行复杂推理、制定计划并自主执行多步骤操作,目前业内热议的数字员工等AI Agent即为相关应用。

图源:英伟达

在生成式AI的之一阶段,AI行业的“Scaling Law”法则集中体现在模型训练上,特别是预训练环节(Pre-Training,即从无到有开发模型的前期训练阶段),投入更多的数据、更大规模的算力资源训练出更好的模型,训练规模越大,模型越智能。

黄仁勋认为,从过去一年的行业发展进程来看,预训练为主的Scaling Law法则已走入“误区”。从今年乃至未来很长一段时间内,Agentic AI将代替生成式AI,成为行业新的发展方向。由于Agentic AI强调自主性与复杂问题解决能力,每一步解决复杂问题、分解任务的逻辑思考过程都需要用到“模型推理”,因此推理将成为新阶段的核心动力。

而从生成式AI发展到Agentic AI,并不意味着Scaling Law法则失效。相反,由于将应用范围从训练进一步扩展到推理,不只在预训练环节,模型的后训练(Post-Training,指预训练得到模型后,根据特定任务或需求,使用更小规模、更专注的数据集对模型进行进一步优化训练或微调的过程)和日常推理的长期思考(Long-Thinking)都要继续消耗算力资源,Scaling Law法则对规模的要求非但会变小,相反会进一步扩大。

以一个用户访问AI应用时产生的Token来举例,对于Agentic AI来说,推理所涉及的任务更加复杂,可能需要生成或处理更多Token来完成规划和执行。同时随着更多用户同时访问AI,Token的数量会爆炸式增加。对于大模型来说,每生成一个Token往往需要数千亿次浮点运算,如何在有限时间内尽可能多的生成Token,并快速将推理结果反馈给用户,大规模的算力资源是完成这一切的基础。

按照现场显示的效果,Blackwell Ultra NVL72集群在运行DeepSeek-R1 671B交互式副本时,只需10秒就可以给出答案,而上一代Hopper架构的H100同类产品则需要1分半。

此次大会上,英伟达还发布了一款新型的AI 推理服务软件Dynamo。它协调和加速数千个GPU之间的推理通信,并使用分解服务将大型语言模型的处理和生成阶段分离在不同GPU上。这允许每个阶段根据其特定需求进行独立优化,并确保更大程度地利用GPU资源。

黄仁勋认为,推理所需算力需求规模增长能“轻松超过去年估计的100倍”,未来行业需要更多、性能更强的AI芯片。根据他的预测,数据中心建设的投入到2028年将达到1万亿美元,目前“相当确定很快就会达到这个目标”。

硅光 *** 交换机、机器人模型与量子计算研究中心

此外,在今年GTC大会上,英伟达还将在硅光芯片、机器人应用、量子计算等领域有进一步的探索。

硅光领域,英伟达最新发布了NVIDIA Spectrum-X(基于以太网,适合兼容更广泛的企业 *** )及NVIDIA Quantum-X(基于InfiniBand,偏向专用计算集群)硅光 *** 交换机。

这两款硅光 *** 交换机新品是英伟达首次利用“光电共封装技术”(co-packaged optics, CPO)将光通信直接集成到交换机上,推出的商用化硅光交换机产品。此前英伟达的交换机产品的光通信部分主要为“外挂式”,依赖从Finisar和Lumentum等外部供应商采购的标准化模块。

此次英伟达的硅光 *** 交换机新品与台积电、Coherent、康宁公司(Corning)、富士康、Lumentum和SENKO等行业巨头合作。Quantum-X交换机预计将于今年晚些时候上市,Spectrum-X交换机预计于2026年通过主流基础设施和系统供应商推出。

黄仁勋曾经用“A工厂”描绘AI时代超大规模数据中心的未来形态。随着AI数据工厂规模的扩张, *** 基础设施也需要同步彻底革新。英伟达希望通过将硅光子技术直接集成到交换机中,突破超大规模和企业 *** 的传统限制,为目前万张、十万张GPU的数据中心向百万张GPU的AI工厂过渡奠定基础。

机器人作为未来“具身AI”(Physical AI)的关键应用,英伟达旗下辅助生成机器人训练数据的物理世界模型Co *** os、人形机器人基础模型GROOT N1以及3D实时仿真平台Omniverse是这一领域的主要产品。

图源:视觉中国

其中,GROOT N1是通用机器人基础模型,英伟达此次正式宣布已经将其开源。GROOT N1模型采用双系统架构,灵感来自人类认知原理。在视觉语言模型的支持下,一个系统可以推理其环境和收到的指令,从而规划行动。另一个系统然后将这些计划转化为精确、连续的机器人动作。

除硅光芯片与机器人应用外,在谷歌、微软相继在量子计算芯片领域有重大突破后,量子计算当前成为了硅谷科技巨头布局未来的一个热门方向。英伟达此次也在GTC大会上宣布,将在波士顿建设NVIDIA加速量子研究中心(NVAQC)。据官方介绍,该中心是一个以研究为导向的机构,将通过尖端技术推动量子计算架构与算法的发展。

值得关注的是,去年谷歌发布的Willow芯片攻克困扰量子计算研究30年的“量子纠错”难题,市场升温带动量子计算概念股上股价涨,黄仁勋曾在今年1月接受分析师采访时给量子计算的落地“泼了一盆冷水”:要造出“非常有用的量子计算机”,可能需要20年。黄的这一评价当时导致一众量子计算相关股票应声下跌。

黄仁勋在谈及英伟达成立量子研究中心的目标时提到,量子计算的实用化依赖于解决关键技术挑战,如量子比特噪声和纠错。而NVAQC的使命是推动这些突破:“NVIDIA加速量子研究中心将是突破发生的地方,以创建大规模、有用的加速量子超级计算机。”

对于市场担忧量子计算颠覆现有计算工具,以前所未有的计算速度在密码学、隐私数据保护领域形成“量子霸权”,黄仁勋明确表示,量子计算不会单独取代现有的计算技术,而是作为AI计算能力的补充。未来的量子计算将成为AI超级计算机的“增强工具”,在药物开发、新材料制造等特定高复杂性领域发挥作用。

  • 美国会对 23andMe 公司破产一事存在疑问
  • 俄乌临时停火结束,特朗普敦促双方本周达成协议
  • 李家超将率团访问浙江
  • 刚刚!11天10板大牛股发声!主力大幅出逃这些股
  • 日本长野一夜连震47次,当局呼吁警惕更大地震
  • 习近平主席东南亚三国行|元首外交硕果累累 • 一图读懂
  • 消息称美国劳工部员工反对DOGE访问敏感数据被解雇
  • 国产漫画《悟空》新书发布 传统文化IP开发再添力作
  • 消博会上各地亮出“首发经济”明牌
  • 纽约联储行长Williams:美国经济增长或放缓 通胀料升温
  • 4月11日美股成交额前20:特斯拉在华停售两款美国进口车型
  • 美银证券:微升太平洋航运目标价至1.7港元 维持“中性”评级
  • 满贯集团复牌高开逾43% 主席王嘉俊1.29亿持股被强制出售
  • 段永平现身浙大聊投资理念:不应总想着赚快钱
  • 三年新增28000个实习岗,腾讯启动史上最大规模就业计划
  • 美学术界发起集体抗议,百余高校联署声明抵制政府干预
  • 吉贝尔:核心产品持续放量 加码新药研发构建长期竞争力
  • 新东方-S获First Beijing Investment Limited增持267.08万股
  • 泰康资产获批设立全资私募基金管理子公司,首期投资规模预计120亿元
  • 沛纳海精简中国销售网络
  • 去年淘宝上衍生周边成交量超百亿元 潮玩行业可能出现下一个泡泡玛特吗?
  • 换到A股 “置顶”! 六大细节看本次国常会
  • 特朗普将更换新上任的国税局局长
  • 中青报头版:怎样做好“咖啡+”?上海年轻人把咖啡店开出新花样
  • 缅甸强震已致该国3735人死亡
  • 美联储哈克称联储积累了很高的信誉,是其目前最强大的力量之一
  • 上海中山医院发布内镜AI:可解读胃肠镜报告,也是手术伙伴
  • 海通国际:首予古茗“优于大市”评级 目标价24.2港元
  • 不负春光百谷生——谷雨时节各地春耕春管一线见闻
  • 昂瑞微冲科创板:3年累亏超8亿元,存货跌价计提存蹊跷
  • 贝莱德在关税暂缓后看好美股 仍回避长期美债
  • 企业跨境支付的最大挑战及解决方案
  • 周五与美国谈判矿产协议,乌克兰准备为军援付款500亿美元
  • 全国田径大奖赛接力摘金,苏炳添的传奇将延续至全运会
  • 一周人物| 萨韦利上海画展,陆永安“从董源到塞尚”
  • 跨境支付概念爆发!恒宝股份涨停,拉卡拉涨超10%,金融科技ETF冲击三连阳
  • 秦洪看盘|流动性有所改善,A股延续修复行情态势
  • 政策聚焦+AI赋能,如何一键布局科创医药之春?
  • 十大流通股东七个在减持套现,复合肥龙头芭田股份史上最强业绩含多重隐忧
  • 探访原阳“最牛高速服务区”:登记后享20项免费服务,已十多年
  • 世界读书日丨这50本书,商务印书馆推荐给教师
  • 尾盘异动!谁在买?
  • 鲁比奥称短期无法达成协议美方可能退出俄乌谈判,美媒爆:美施压对象主要是乌克兰
  • 大湾区楼市“小阳春”亮眼:深圳新房网签环比增长67.5%,广州二手房成交破万套
  • 视频|李大霄:中国股市或步入潜力牛
  • 东·华尔丹出任北方民族大学校长
  • 近千座寺院、佛塔在强震中受损,“多灾多难”的缅甸文化场所何去何从
  • 渣打:解职鲍威尔会有损美元 提振避险资产
  • 如意集团业绩大变脸或涉嫌信披违规 频繁踩监管红线
  • 深一度|上海半马,展示“体育+”无限可能的路跑狂欢
  • 业主被开发商“背刺”,119万买房4年后只值40万
  • 美国WTI原油基本持平 摩根大通下调今明两年油价预期
  • 界面晚报 | 中共中央、国务院发文实施自贸区提升战略;超1230名经济学家警告美国自残式衰退
  • 小米首款SUV车型登顶热搜,雷军发文解释提早公示原因
  • 英国首相斯塔默与特朗普讨论贸易问题
  • 江西修水警方:一民房内发生刑案,犯罪嫌疑人已被抓获
  • 打新早报|半导体探针概念矽电股份、电气装备新亚电缆今日申购
  • 3个10万+项目入市售罄,上海楼市“关键三月”稳住了,“银四”行情可期
  • 欧洲债市:德债上涨 关税风险支撑避险需求
  • 【专访】卢锋:特朗普试图用高关税促进制造业大规模回流的目标难以实现
  • 推动全民国家安全教育走深走实,上海举行实践宣讲会
  • 且初背后的这家公司,有可能成为中国宝洁吗?
  • 广发基金刘格崧一季报:首次买入广东宏大、分众传媒,减仓亿纬锂能
  • 特朗普完成第二任期首次体检 自夸“状态很好,认知测试全答对”!
  • 秦洪看盘|流动性有所改善,A股延续修复行情态势
  • 特朗普暗示伊朗拖延谈判 重申必要时会考虑打击其核设施
  • 一周新车盘点 | 大众途昂正式换代 奔驰CLA级首搭新平台  
  • 从6家试点扩展至全行业,券商并表监管有何看点?
  • 可灵AI全系模型升级,人人导演时代将为快手带来哪些新故事?
  • 美团小象超市被曝将开线下门店
  • 直击杭州银行业绩会:正积极寻求大股东可转债转股等方面支持
  • 大气科学家、北京大学副教授李成才逝世,终年56岁
  • 新童谣童诗征稿活动在沪开启:设三个创作主题,面向全国征集
  • 午盘:美股大幅下滑 道指重挫逾1000点
  • 履新荆州市委书记次日,汪元程走访看望老同志
  • 北京将严查大数据杀熟和强制搭售等五种网络销售违法行为
  • 欧元创2009年以来最快涨势 交易员押注将进一步升至1.20美元
  • ETF日报:半导体产业链存在中长线的投资机会,近期科技波动较大,可关注集成电路ETF
  • 闻所未闻 一房产中介开始考核银行员工业绩!
  • 娃哈哈跨行做鞋,“AD钙奶”鞋走红!线定价低于150元
  • 推动沪克两地“算力结对”合作,这场推介会在上海举行
  • 谈判进展甚微,欧盟对美关税征收范围将扩大至厕纸和化妆品
  • 任天堂Switch 2将于4月24日开始在美零售预订 此前因关税延迟
  • 云南一季度GDP为7490.99亿元,同比增长4.3%
  • 美联储官员Collins:关税影响范围将超出许多美国人预期
  • 观点综述:戴蒙警示风暴之海 纽约联储行长料增长放缓
  • 2025中国互联网企业家座谈会在京召开
  • 贝莱德在关税暂缓后看好美股 仍回避长期美债
  • 康师傅控股委任曾倩为薪酬及提名委员会成员
  • 一周新车盘点 | 仰望U7首搭水平对置发动机 阿维塔06开启预售
  • 特朗普允诺美国一个黄金时代但事与愿违 关税政策却给了美企重重一击
  • 雨来了!下周南方将有三轮降雨 22日起两广旱区迎甘霖
  • 和评理|全球深化合作抵制美国宰割
  • 欧盟下月将公布停止进口俄石油和天然气的路线图
  • 泼天流量砸向敦煌网
  • 安眠药吃多了真会变傻?医生大实话来了
  • 登封齐鲁村镇银行被罚1.5万元:违反安全管理要求
  • 国产漫画《悟空》新书发布 传统文化IP开发再添力作
  • 股市下跌时退休人员面临 “危险区” 如何保护你的投资组合?
  • 建发拿下成都杭州“地王”,2025年要全力增长,销售目标1500亿
  • 猪价近期超预期上涨,分析师称或难改后期下跌趋势
  • 叶国富:永辉今年的核心是减亏,明年全面完成调改
  • 福耀玻璃去年业绩再创新高,拟增资4亿美元扩建在美产能
  • 特朗普政府要求哈佛大学提供关于从外国来源所获资金的记录
  • 关键词: