AI芯片供应紧张局面逐渐缓和
英伟达H100正被抛出 租用更容易

越来越多的证据表明,人工智能芯片的供应紧张问题正有所缓和,一些购买了大量英伟达H100 80GB处理器的公司现在正试图转售这些处理器。

目前,据悉用于人工智能(AI)和高性能计算(HPC)应用的英伟达H100 GPU的交付周期已从8-11个月大幅缩短至3-4个月。

据报道,一些公司正在转售他们的H100 GPU或减少订单,因为这些芯片的稀缺性开始下降,并且维护这些尚未使用库存的成本也很高。

此类情形与一年前相比出现重大转变,当时获得英伟达的Hopper GPU是一个重大挑战。

目前人工智能处理器供应短缺的缓解还表现在,从AWS、谷歌云和微软Azure等云服务提供商租用英伟达的H100 GPU变得更加容易了。

例如,AWS推出了一项新服务,允许客户安排更短时间的GPU租赁,解决了之前芯片可用性的问题,这导致获得人工智能芯片的等待时间在减少。

尽管芯片可得性有所提高,交货时间也大大缩短,人工智能芯片的需求仍然远远超过供应。

特别是那些自己开发并培训大型语言模型的公司仍然面临供应问题,很大程度上是因为他们需要的GPU数量过于庞大。这些公司在获得所需处理器或容量方面仍面临着几个月的延迟。

也正因如此,英伟达H100和其他处理器的价格并没有下降,该公司也继续享有高利润率。

不过,随着诸多英伟达处理器的替代品接连问世,例如AMD和AWS的处理器,该市场可能会迎来更加平衡的局面。

还有一点原因是,各公司对人工智能处理器的支出也变得更加谨慎了。

无论如何,就目前而言,市场对人工智能芯片的需求依然强劲,并且随着大型语言模型越来越大,对计算性能的需求也越来越高。


weidian.jpg

通知公告
编辑观点
理事会
参考资料
版权声明

凡《网络安全与数据治理》(原《信息技术与网络安全》)录用的文章,如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明,即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊,本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时,本刊支付的稿酬已包含上述使用的费用,特此声明。

《网络安全与数据治理》(原《信息技术与网络安全》)编辑部