DeepSeek采用UE8M0 FP8标准彻底和英伟达决裂

8月25日消息，近日，深度求索宣布正式发布DeepSeek-V3.1。其中一个重大的进步和惊喜，就是支持了UE8M0 FP8。

DeepSeek在其官宣发布DeepSeek-V3.1的文章中提到，UE8M0 FP8是针对即将发布的下一代国产芯片设计。

东莞证券指出，该格式通过更高的灵活度支持复杂模型推理，提升芯片的解码效率与运算能力，为国产芯片适配更大模型提供技术路径，国产AI算力生态有望加速成型。

那UE8M0 FP8到底是什么？将有何影响？

人工智能领域的企业家与技术专家、清华大学计算机系人工智能所博士梁斌表示，DeepSeek这次为什么非要强调UE8M0 FP8呢？这个和英伟达的FP8是两个东西，两套标准。

他解释称，显存的发展是有限的，而模型的发展是快速的，对每个参数的表达必须通过量化进行压缩，FP32就是32位表达一个参数，FP8就是8位表达一个参数，在可接受的范围内，肯定是越低的表达，在显存里面能装下更多的参数。

FP8有英伟达的E4M3/E5M2方案和DS的这个UE8M0方案，主要区别就是前者有3-2位的小数表达，后者没有小数表达。前者精度好，后者功耗低，运算快，对芯片要求低。

梁斌表示，现在DeepSeek支持UE8M0 FP8，加上国产芯片都向这个标准靠拢，这是彻底和英伟达决裂了，以后其他推理模型，要么选择DS这套体系，要么选择英伟达体系，国内芯片公司也积极向这套体系靠拢。

“现在华为他们那边真是为了适配这个标准，真是玩命干，干成了就是名垂千古，多大诱惑，而且我发现DeepSeek还真是有胆量，真是把国产大模型的发展推到了一个牛X的高度上去，太了不起了。”

Magazine.Subscription.jpg

通知公告

编辑观点

理事会

参考资料

凡《网络安全与数据治理》（原《信息技术与网络安全》）录用的文章，如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明，即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊，本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时，本刊支付的稿酬已包含上述使用的费用，特此声明。

作者投稿

在线期刊

下载中心

信网杯

《网络安全与数据治理》（原《信息技术与网络安全》）编辑部