技术原理

【以理解人类为中心的人工智能】冯晓毅|基于空时注意力网络的面部表情识别

本专题发表于《西北大学学报》(自然科学版)2020年第3期

主持人语

随着科学技术的快速发展,人工智能技术已被广泛应用于人类生活的各个方面。为了让人工智能更好地服务于人类,首要需求是“理解人类”:理解人的情感和行为,进而模仿人类与人交流。因此,我们认为以理解人类为中心的人工智能技术将是一个重要的研究方向。与理解人类的语音信号分析和自然语言处理问题不同,计算机视觉任务更加宽泛。在当前的计算机视觉领域,面向理解人类的研究主要集中在人脸分析和行为分析。针对这一新兴的研究热点,本栏目将探讨基于计算机视觉的人脸表情识别、表情合成和行为分析等相关问题,提出解决办法,为以理解人类为中心的人工智能技术应用抛砖引玉。
【主持人】彭进业,教授,博士生导师,西北大学信息科学与技术学院院长,教育部创新团队负责人。

专题目录

以理解人类为中心的人工智能
1.MeGAN:基于多任务增强生成对抗网络的图像合成(彭进业,曹煜,章勇勤,彭先霖,李展,王珺,张群喜,杨蕊)
2.基于空时注意力网络的面部表情识别(冯晓毅,黄东,崔少星,王坤伟)
3.人工智能中面向人类的行为分析(石恒麟,赵国英)

基于空时注意力网络的面部表情识别

作者:冯晓毅1,黄东1,崔少星2,王坤伟1

单位:1.西北工业大学电子信息学院;2.西安理工大学 自动化与信息工程学院

本文OSID码
(扫描可与本文作者进行学术交流)

摘要

基于视频序列的面部表情识别问题主要有两个特点:空时性和显著性。近年来,许多研究人员利用卷积神经网络、循环神经网络、三维卷积神经网络等深度学习方法处理该问题的空时特性。但是,面部表情的显著性问题却往往被忽视。随着注意力机制在深度学习网络中的应用发展,其能够有效地解决各类任务中的显著性问题。该文将空时注意力机制应用到面部表情识别中,使得深度网络更多地关注空时特征中的显著性。具体地,该文将空间注意力模块嵌入到卷积网络中,以使空域特征更加关注对表情识别重要的区域,将时间注意力模块嵌入到门控循环单元(gated recurrentunits,GRU)后,使得时域特征更加关注信息丰富的视频帧。在RECOLA情感数据库上的实验表明,与一般的深度模型相比,该文的深度空时注意力网络显著提高了面部表情识别的性能。

关键词

深度学习;空时方法;注意力机制;面部表情识别

作者简介

冯晓毅,女,陕西西安人,教授,博士生导师,从事计算机视觉和模式识别研究。

以下文章图片可点开左右滑动查看

往期精彩:

《西北大学学报》(自然科学版)2020年1期目录及摘要

《西北大学学报》(自然科学版)2020年2期目录及摘要

《西北大学学报》(自然科学版)2020年3期目录及摘要

【高专论谈】龙晓平|青藏高原南部碰撞造山过程中的大陆地壳生长作用

【高专论谈】韩英锋|氮杂环卡宾化合物的研究进展

【高专论谈】华洪|埃迪卡拉纪末期管状动物的“大辐射”

【高专论谈】管子玉|基于多任务学习的口腔白斑与扁平苔藓的分割与识别

更多内容请访问《西北大学学报》首页了解:http://jnwu.nwu.edu.cn/

《西北大学学报》(自然科学版)

官方微信

投稿:xbdz.cbpt.cnki.net

电话:029-88302822

邮箱:xdxbzr@nwu.edu.cn

(微信号:JNWU_ZR)

长按二维码关注

微信编辑:李静

欢迎关注哲学社会科学版官方微信

(微信:JNWU_ZS)

你也可能喜欢

发表评论

您的电子邮件地址不会被公开。 必填项已用 * 标注

提示:点击验证后方可评论!

插入图片
人工智能电影简介 投稿者
我还没有学会写个人说明!
最近文章
  • * 没有更多文章了
  • 热门搜索

    分类目录