中国联通发布元景思维链大模型
央企首个开源的通用思维链大模型

1月24日消息,今日,中国联通宣布,联通数据智能有限公司日前发布元景思维链大模型

目前,元景思维链模型已在GitHub、魔搭、始智等社区全面开源。

作为央企首个开源的通用思维链大模型,元景思维链大模型既拥有强大慢思考能力,又具备不限于数学的多学科、多场景通用推理能力,且能做到针对不同任务和难度的自适应慢思考,大幅降低资源消耗。

中国联通表示,主流榜单的测评结果显示,元景思维链大模型的表现超过了目前最好的通用语言模型(OpenAI GPT-4o和Deepseek V3)以及开源思维链模型通义千问QwQ。 

1.png

2.png

据介绍,元景思维链大模型通过任务自适应和难度自适应两种策略来实现模型的“自适应慢思考”。

在非推理任务测评集上对比,元景思维链模型在保证正确率的情况下明显倾向于生成更短的答案(长度小于100和200个token的数量明显多于通义千问QwQ):

该大模型在评估模型生成的长思维链数据时,除了考虑生成的答案正确与否,还综合考虑了问题的难度以及生成答案的长度,通过强化学习让模型将答案长度与当前问题的难度相匹配。

根据官方演示,元景思维链模型可顺利解答物理、化学高考真题、24点游戏、逻辑推理等问题。

3.png

4.png

5.png

6.png

7.png

8.png


Magazine.Subscription.jpg

通知公告
编辑观点
理事会
参考资料
版权声明

凡《网络安全与数据治理》(原《信息技术与网络安全》)录用的文章,如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明,即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊,本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时,本刊支付的稿酬已包含上述使用的费用,特此声明。

《网络安全与数据治理》(原《信息技术与网络安全》)编辑部