英伟达官宣新一代GPU 推理算力是Blackwell的5倍

1月6日消息,TheVerge报道,英伟达CEO黄仁勋在CES 2026主题演讲中宣布,新一代“Rubin计算架构平台已正式进入量产阶段。

该平台包含六款新型芯片,分别为Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU及Spectrum-6以太网交换机。目前,这六款芯片已从合作制造方处回厂,并通过部分关键测试,整体进度正按计划推进。

s_613f01226e9343dfb9b8f7d9341f3eac.png

据英伟达公布的数据,Rubin平台的训练性能达到前代Blackwell的3.5倍,运行AI软件的性能提升5倍。此外,其推理token生成成本可降低多达10倍,训练混合专家模型(MoE)所需的GPU数量也减少至原来的四分之一。

新一代Vera CPU配备88个核心,性能为替代产品的两倍。该处理器专为代理推理设计,被视为大规模AI工厂中能效最高的CPU,采用88个定制Olympus核心,支持完整Armv9.2架构,并搭载高速NVLink-C2C互连技术。

Rubin GPU集成第三代Transformer引擎,具备硬件加速自适应压缩功能,可为AI推理提供50 petaflops的NVFP4算力。每个GPU带宽达3.6TB/s,而Vera Rubin NVL72机架的整体带宽更提升至260TB/s。

英伟达同时透露,包括亚马逊AWS、谷歌云、微软Azure和甲骨文云在内的多家云服务商将于2026年率先部署基于Vera Rubin的实例。此外,CoreWeave、Lambda、Nebius和Nscale等云合作伙伴也将陆续跟进。

s_77a3637ca4dc41d4b3ed6dd8240ae4b2.jpg


subscribe.jpg

通知公告
编辑观点
理事会
参考资料
版权声明

凡《网络安全与数据治理》(原《信息技术与网络安全》)录用的文章,如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明,即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊,本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时,本刊支付的稿酬已包含上述使用的费用,特此声明。

《网络安全与数据治理》(原《信息技术与网络安全》)编辑部