11月9日消息,长期以来,NVIDIA凭借其强大的CUDA生态系统,在AI领域占据主导地位,而竞争对手如AMD的ROCm等相对不够成熟,不过这一格局正迎来新的破局者微软。
据一位“高级别”微软员工透露,其已开发出“工具包”,能够将NVIDIA CUDA模型转换或转译为ROCm兼容代码,使其能在AMD的GPU上运行。
此举旨在打破CUDA的“生态锁定”,为微软日益增长的AI推理工作负载寻找更具成本效益的替代方案。
微软此番行动的核心驱动力在于,他们观察到AI推理工作负载的需求正在大幅增加,与昂贵的NVIDIA GPU相比,AMD的AI芯片在推理场景中具备更佳的性价比。
通过软件转换,微软可以利用AMD的硬件优势来降低运营成本。
据推测,该工具包可能采用类似ZLUDA的运行时兼容层技术,在不修改源代码的情况下,将CUDA API调用实时翻译成ROCm指令。
不过由于ROCm相对“不成熟”,部分CUDA代码仍缺乏对应的映射,可能导致性能下降,这在大型数据中心环境中仍是一个挑战。

凡《网络安全与数据治理》(原《信息技术与网络安全》)录用的文章,如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明,即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊,本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时,本刊支付的稿酬已包含上述使用的费用,特此声明。