[发明专利]表情识别方法、装置、设备及计算机存储介质在审
申请号: | 202011481968.2 | 申请日: | 2020-12-15 |
公开(公告)号: | CN112560679A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 王珂尧 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 阎敏;杨瑾瑾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表情 识别 方法 装置 设备 计算机 存储 介质 | ||
1.一种表情识别方法,包括:
根据包含人脸图像的目标图像获得输入数据;
将所述输入数据输入表情识别模型,获得识别结果,所述表情识别模型包括至少一层时序偏移模块和二维卷积神经网络结合的特征提取层;
根据所述表情识别模型的识别结果,确定所述目标图像的人脸表情类型。
2.根据权利要求1所述的方法,其中,所述表情识别模型为视觉几何小组VGG模型,所述VGG模型包含多层所述特征提取层。
3.根据权利要求1所述的方法,其中,所述目标图像包括多个帧图像;所述根据包含人脸图像的目标图像获得输入数据之前,还包括:
从视频中提取包括人脸图像的所述多个帧图像;
对所述多个帧图像进行人脸识别,得到所述多个帧图像的人脸区域;
对所述多个帧图像的人脸区域进行关键点检测,得到人脸关键点的坐标;
根据所述人脸关键点的坐标,进行人脸区域对齐。
4.根据权利要求3所述的方法,其中,所述根据包含人脸图像的目标图像获得输入数据,还包括:
根据所述人脸关键点的坐标,将所述多个帧图像的人脸区域调整至同样大小;
获得调整后的人脸区域所包括的人脸关键点的新坐标;
根据调整后的人脸区域以及所述新坐标,获得所述输入数据。
5.根据权利要求1-4中任意一项所述的方法,其中,所述将所述目标图像输入表情识别模型,获得识别结果,包括:
采用所述时序偏移模块对所述输入数据进行时序偏移操作;
采用所述二维卷积神经网络对所述时序偏移操作处理后的输入数据进行空间维度的卷积操作;
根据所述卷积操作处理后的输入数据,获得识别结果。
6.一种表情识别的装置,包括:
输入数据获得模块,用于根据包含人脸图像的目标图像获得输入数据;
识别模块,用于将所述输入数据输入表情识别模型,获得识别结果,所述表情识别模型包括至少一层时序偏移模块和二维卷积神经网络结合的特征提取层;
表情类型确定模块,用于根据所述表情识别模型的识别结果,确定所述目标图像的人脸表情类型。
7.根据权利要求6所述的装置,其中,所述表情识别模型为视觉几何小组VGG模型,所述VGG模型包含多层所述特征提取层。
8.根据权利要求6所述的装置,其中,所述目标图像包括多个帧图像;所述装置还包括:
图像提取模块,用于从视频中提取包括人脸图像的所述多个帧图像;
图像识别模块,用于对所述多个帧图像进行人脸识别,得到所述多个帧图像的人脸区域;
关键点坐标获得模块,用于对所述多个帧图像的人脸区域进行关键点检测,得到人脸关键点的坐标;
人脸区域对齐模块,用于根据所述人脸关键点的坐标,进行人脸区域对齐。
9.根据权利要求8所述的装置,其中,所述输入数据获得模块,还包括:
人脸区域调整单元,用于根据所述人脸关键点的坐标,将所述多个帧图像的人脸区域调整至同样大小;
调整计算单元,用于获得调整后的人脸区域所包括的人脸关键点的新坐标;
调整数据处理单元,用于根据调整后的人脸区域以及所述新坐标,获得所述输入数据。
10.根据权利要求6-9中任意一项所述的装置,其中,所述识别模块包括:
偏移单元,用于采用所述时序偏移模块对所述输入数据进行时序偏移操作;
卷积单元,用于采用所述二维卷积神经网络对所述时序偏移操作处理后的输入数据进行空间维度的卷积操作;
卷积识别单元,用于根据所述卷积操作处理后的输入数据,获得识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011481968.2/1.html,转载请声明来源钻瓜专利网。