8月25日消息,近日,深度求索宣布正式发布DeepSeek-V3.1。其中一个重大的进步和惊喜,就是支持了UE8M0 FP8。

DeepSeek在其官宣发布DeepSeek-V3.1的文章中提到,UE8M0 FP8是针对即将发布的下一代国产芯片设计。

东莞证券指出,该格式通过更高的灵活度支持复杂模型推理,提升芯片的解码效率与运算能力,为国产芯片适配更大模型提供技术路径,国产AI算力生态有望加速成型。
那UE8M0 FP8到底是什么?将有何影响?
人工智能领域的企业家与技术专家、清华大学计算机系人工智能所博士梁斌表示,DeepSeek这次为什么非要强调UE8M0 FP8呢?这个和英伟达的FP8是两个东西,两套标准。
他解释称,显存的发展是有限的,而模型的发展是快速的,对每个参数的表达必须通过量化进行压缩,FP32就是32位表达一个参数,FP8就是8位表达一个参数,在可接受的范围内,肯定是越低的表达,在显存里面能装下更多的参数。
FP8有英伟达的E4M3/E5M2方案和DS的这个UE8M0方案,主要区别就是前者有3-2位的小数表达,后者没有小数表达。前者精度好,后者功耗低,运算快,对芯片要求低。
梁斌表示,现在DeepSeek支持UE8M0 FP8,加上国产芯片都向这个标准靠拢,这是彻底和英伟达决裂了,以后其他推理模型,要么选择DS这套体系,要么选择英伟达体系,国内芯片公司也积极向这套体系靠拢。
“现在华为他们那边真是为了适配这个标准,真是玩命干,干成了就是名垂千古,多大诱惑,而且我发现DeepSeek还真是有胆量,真是把国产大模型的发展推到了一个牛X的高度上去,太了不起了。”

凡《网络安全与数据治理》(原《信息技术与网络安全》)录用的文章,如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明,即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊,本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时,本刊支付的稿酬已包含上述使用的费用,特此声明。