0 引言
自AlexNet以巨大的优势在ImageNet图像识别比赛中夺冠后,深度学习在视觉、语音、自然语言处理等方面取得了飞速的进展和巨大的成功。深度学习发展主要依赖于算力的提升和算法的进步。算力的提升主要在于GPU、TPU等硬件的应用与发展;而算法的进步多种多样,例如优化方法的改进、激活函数的选择等。本文主要关注于使用神经网络架构搜索的方法构建轻量级神经网络,主要工作包括:
(1)设计了一种自动计算模型浮点数运算次数的算法。浮点数运算次数是反映神经网络规模与运行速度的一个重要指标,也是一个动态的过程,可以看作架构参数的函数,除了具体的数值外,本文还计算了其对架构参数的偏导数。
(2)基于梯度的神经网络架构搜索,改进设计了一种带约束的架构搜索方法。在实际任务中,为了使模型能运行在特定设备上,通常对模型的规模或运行速度等有一定的要求。不加约束的搜索,得到的模型很可能不满足要求。本文实现的约束算法并不限于某一种特定约束,而是实现了一种接口,加入了对模型运行时延、模型规模多种不同的约束。
(3)利用带有浮点数运算次数约束的架构搜索算法,搜索到几种高性能神经网络架构。在几个公开数据集上测试并对比其在图像分类任务上的准确率,并与工业界常用的神经网络模型进行比较。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003259
作者信息:
宋存洋,李 欣
(中国电子科技集团公司第二十八研究所,江苏 南京210007)
凡《网络安全与数据治理》(原《信息技术与网络安全》)录用的文章,如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明,即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊,本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时,本刊支付的稿酬已包含上述使用的费用,特此声明。