[发明专利]一种基于attention特征融合的多模态情感识别的方法在审
申请号: | 201811441300.8 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109614895A | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 李玉军;宋绪靖;马浩洋 | 申请(专利权)人: | 山东大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06F17/27;G06N3/04 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 杨树云 |
地址: | 250199 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于attention特征融合的多模态情感识别方法,本发明主要利用了文本、语音和视频三个模态的数据来进行最后的情感识别。首先我们对三个模态的数据分别进行特征提取。文本方面采用双向LSTM来进行文本特征的提取,语音模态采用卷积神经网络进行特征提取,而视频模态采用了三维卷积神经网络模型进行视频特征的提取。然后将三个模态的特征采用基于attention特征层融合的方式进行特征融合,改变了传统的特征层融合方式,充分利用了不同模态之间的互补信息,给不同的模态的特征赋予一定的权重,权重是和网络一起训练学习得到,因此更加符合我们的整个数据分布,很好的提高了最后的识别效果。 | ||
搜索关键词: | 模态 情感识别 特征融合 卷积神经网络 特征提取 多模态 特征层 权重 文本 互补信息 视频模态 视频特征 数据分布 文本特征 训练学习 传统的 语音模 融合 三维 视频 语音 赋予 网络 | ||
【主权项】:
1.一种基于attention特征融合的多模态情感识别的方法,其特征在于,包括步骤如下:(1)对多个模态的数据进行预处理,使其符合多个模态对应的模型的输入要求;(2)对步骤(1)预处理后的多个模态的数据进行特征提取;(3)将步骤(2)提取到的多个模态的数据特征进行特征融合:采用attention机制,将步骤(2)提取到的多个模态的数据特征分别赋予一个权重,形成一个初始模态特征权重矩阵,通过训练学习,得到每个模态的数据特征的权重,之后将得到的每个模态的数据特征的权重与对应的每个模态的数据特征进行加权融合,得到联合特征向量,送到分类器进行分类;(4)训练模型;将步骤(1)预处理后的多个模态的数据打乱后,分成若干份,设定为N份,每次取N‑1份做训练,剩下1份做验证,做N次交叉验证,得到最终实验结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811441300.8/,转载请声明来源钻瓜专利网。