基于混合注意力机制的表情识别研究

0     引言

  人脸表情识别作为人机交互的重要组成部分,一直是计算机视觉的研究热点,被广泛应用于公共安全、在线教育、医疗等领域。目前,表情识别的研究工作主要分为传统的人工特征提取和基于深度学习两个方向。人工特征常被用于提取图像的外观特征,包括Gabor、HOG以及局部二进制LBP等。但由于人工特征受限于算法的设计,计算复杂,在表情识别中效果不佳,正逐渐被基于深度学习的卷积神经网络所取代。

  利用深度学习进行图像识别任务时,通常选择增加卷积神经网络的深度、宽度以及丰富网络感受野的方式来提升网络性能和容量。而在网络中引入注意力机制相比以上三种方式可以使网络重点关注图像细节特征,将原先的平均分配资源变成根据关注对象的重要程度进行重新分配,对模型中不同部分赋予权重,从中提取关键特征信息。文献[4]提出SENet网络结构,采用压缩和激励模块(SqueezeandExcitation block,SE),对重要通道特征进行强化从而提升识别率。文献[5]提出瓶颈注意力模块,可与任何前向传播神经网络结合。文献[6]提出一种卷积注意力模块(Convolutional Block Attention Module,CBAM),结合了空间注意力和通道注意力,相比SENet[4]只包含通道注意力识别效果更佳。



本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003115





作者信息:

高健,林志贤,郭太良

(福州大学 物理与信息工程学院,福建 福州 350116)


通知公告
编辑观点
理事会
参考资料
版权声明

凡《网络安全与数据治理》(原《信息技术与网络安全》)录用的文章,如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明,即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊,本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时,本刊支付的稿酬已包含上述使用的费用,特此声明。

《网络安全与数据治理》(原《信息技术与网络安全》)编辑部