我国多数模型使用的中文数据占比超60%
部分已达80%

8月14日消息,今日国务院新闻办公室举行“高质量完成‘十四五’规划”系列主题新闻发布会,国家数据局介绍“十四五”时期数字中国建设发展成就。

国家发展改革委党组成员、国家数据局局长刘烈宏介绍,经过多年持续攻坚,我国在数字领域突破了一批关键核心技术,展示出我国显著的发展成绩。集成电路加快布局,形成覆盖设计、制造、封装测试、装备材料的完整产业链;国产操作系统加速崛起,鸿蒙系统生态设备总量突破11.9亿台,为手机、汽车、家电等1200多类产品装上“智能中枢”;我国人工智能综合实力实现整体性、系统性跃升,人工智能专利数量占全球总量的60%。

刘烈宏还在新闻发布会上表示,大家非常关心中文数据占训练数据的比重问题,经过一段时间的努力,国内多数模型使用的中文数据占比已超过60%,有的模型已达到80%。中文高质量数据的开发和供给能力持续增强,使得我国模型性能快速提升。


Magazine.Subscription.jpg

通知公告
编辑观点
理事会
参考资料
版权声明

凡《网络安全与数据治理》(原《信息技术与网络安全》)录用的文章,如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明,即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊,本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时,本刊支付的稿酬已包含上述使用的费用,特此声明。

《网络安全与数据治理》(原《信息技术与网络安全》)编辑部