日前,DeepSeek宣布DeepSeek V3模型完成小版本升级,版本号为DeepSeek-V3-0324。
27日晚,摩尔线程宣布,其迅速响应并完成了对DeepSeek-V3的无缝升级,实现了零报错、零兼容性问题的光速部署。
摩尔线程表示,在Deepseek-V3-0324模型上的光速适配,再次有力验证了国产全功能GPU在推动大模型产业化落地方面的巨大潜力。
据了解,DeepSeek-V3-0324模型参数从初代V3的6710亿小幅增至6850亿,依然采用混合专家(MoE)架构,每个token激活约370亿参数,在推理、编程、数学、中文处理等多个领域达到行业领先水平。
根据DeepSeek官方发布的测试报告,DeepSeek-V3-0324在各项能力评测中表现出色。
DeepSeek-V3-0324不仅全面超越Claude-3.7-Sonnet与Qwen-Max等同类型优质模型,更在数学、代码类等相关评测集上胜过了GPT-4.5。


凡《网络安全与数据治理》(原《信息技术与网络安全》)录用的文章,如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明,即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊,本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时,本刊支付的稿酬已包含上述使用的费用,特此声明。