[发明专利]情感识别方法、装置、存储介质、及处理器在审
申请号: | 202210361942.7 | 申请日: | 2022-04-07 |
公开(公告)号: | CN114639155A | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 黎明欣;饶宇熹;王远楷;宁博 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/80;G06K9/62;G10L15/02;G10L15/16;G10L25/63 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周春枚 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感 识别 方法 装置 存储 介质 处理器 | ||
本申请公开了一种情感识别方法、装置、存储介质、及处理器。涉及人工智能领域,该方法包括:获取目标对象的待识别人脸图像和待识别语音信息;确定待识别人脸图像中的人脸特征和待识别语音信息中的语音特征;将人脸特征和语音特征进行融合,得到融合特征;基于特征融合分类模型对融合特征进行分析,得到融合分类数值,其中,特征融合分类模型是由多组融合分类数据通过机器学习训练出的,多组融合分类数据中的每组融合分类数据均包括:融合特征和标定的融合分类数值;基于融合分类数值确定目标对象的情感识别结果。通过本申请,解决了相关技术中情感识别结果不准确的问题。
技术领域
本申请涉及人工智能领域,具体而言,涉及一种情感识别方法、装置、存储介质、及处理器。
背景技术
随着计算机视觉技术的飞速发展,人机交互逐渐得到重视,情感识别作为人机交互的重要部分,也开始受到广泛关注,如何使用计算机快速识别人类情感成为计算机视觉领域的研究热点。
目前国内外对于情感识别的方法主要分为基于单一模态的识别和基于多模态的识别。基于单一模态情感识别是指采集并分析单一通道的信息,最后通过一定的技术手段获得被测试者的情感状态的一种方法,这种方法存在一点的局限性;基于多模态的方法则是融合多个通道的信息进行情感判断,其主流的融合方式包括决策级融合方式。
决策级融合方式使用不同的分类器对不同的情感表达方式进行建模,最后把每个分类器的识别结果融合在一起。其实现方式是,使用不同的模块分别处理音频和视频特征,求出各自对应的识别率,最后根据比例评分机制和相应的权重分配策略得到最终的识别结果。
但是,现有的决策融合方式存在以下不足:一、不同分类器结果所占的比例和权重没有严格的依据和统一的标准,同一项目不同研究者按照不同的比例和权重往往得到不一样的结果;二、决策融合方式侧重对识别结果的融合,而忽略的不同通道特征之间的内在联系。
因此,基于上述不足,现有情感识别方法存在识别结果不准确的问题。
针对相关技术中情感识别结果不准确的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种情感识别方法、装置、存储介质、及处理器,以解决相关技术中情感识别结果不准确的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种情感识别方法。该方法包括:获取目标对象的待识别人脸图像和待识别语音信息;确定所述待识别人脸图像中的人脸特征和所述待识别语音信息中的语音特征;将所述人脸特征和所述语音特征进行融合,得到融合特征;基于特征融合分类模型对所述融合特征进行分析,得到融合分类数值,其中,所述特征融合分类模型是由多组融合分类数据通过机器学习训练出的,所述多组融合分类数据中的每组融合分类数据均包括:融合特征和标定的融合分类数值;基于所述融合分类数值确定所述目标对象的情感识别结果。
可选地,基于所述融合分类数值确定所述目标对象的情感识别结果包括:判断所述融合分类数值是否不小于预定阈值;在所述融合分类数值不小于预定阈值的情况下,基于所述融合分类数值确定所述目标对象的情感识别结果;在所述融合分类数值小于预定阈值的情况下,基于人脸分类模型分析所述人脸特征得到人脸分类数值,基于语音分类模型分析所述语音特征得到语音分类数值;基于所述融合分类数值、所述人脸分类数值和所述语音分类数值,确定所述目标对象的情感识别结果,其中,所述人脸分类模型是由多组人脸分类数据通过机器学习训练出的,所述多组人脸分类数据中的每组人脸分类数据均包括:人脸特征和标定的人脸分类数值,所述语音分类模型是由多组语音分类数据通过机器学习训练出的,所述多组语音分类数据中的每组语音分类数据均包括:语音特征和标定的语音分类数值。
可选地,获取目标对象的待识别人脸图像和待识别语音信息包括:获取所述目标对象的待识别视频;将所述待识别视频分解为图像帧序列和语音信号;利用人脸检测算法对所述图像帧序列进行预处理,得到所述待识别人脸图像;利用梅尔频率倒谱系数对所述语音信号进行预处理,得到所述待识别语音信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210361942.7/2.html,转载请声明来源钻瓜专利网。