5月11日消息,随着AI需求转向推理时代,算力不再是主要瓶颈,内存墙的问题愈发严重,高带宽低延迟的内存架构成为挑战,现在国内公司也通过架构创新实现了飞跃。
日前新紫光集团宣布推出“紫弦”三维化近存计算(PNM)架构,以3D DRAM为核心,首创3.5D异质异构集成方案,存储带宽可达30TB/s。
这是什么概念呢,目前AMD及NVIDIA再用的HBM3e显存单个带宽也就1.2TB/s,B200显卡带宽也就做到了8TB/s,紫弦的30TB/s带宽可以说碾压性领先。
不仅如此,该架构的延迟也非常低,PNM近存计算模式下访存延迟最大降低18倍。
与NVIDIA的B200显卡相比,模拟仿真显示同等算力下Token吞吐率较B200系列高出1.5至2倍以上。
这次发布的技术也不只是纸上谈兵,新紫光强调该技术可规模化量产,更重要的一点是不会被国外技术限制,它是基于国内领先供应链做的可规模化量产。
不过该技术具体什么时候量产上市还没消息,只能说国产的AI系统完全可以在先进制程受限制的情况下,通过架构和技术创新走一条不同的路。
凡《网络安全与数据治理》(原《信息技术与网络安全》)录用的文章,如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明,即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊,本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时,本刊支付的稿酬已包含上述使用的费用,特此声明。