[发明专利]基于多模态特征提取与融合的语音情感识别方法有效
申请号: | 202110100299.8 | 申请日: | 2021-01-24 |
公开(公告)号: | CN112765323B | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 任传伦;郭世泽;巢文涵;张先国;夏建民;姜鑫;孙玺晨;俞赛赛;刘晓影;乌吉斯古愣 | 申请(专利权)人: | 中国电子科技集团公司第十五研究所;北京间微科技有限责任公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/683;G06F40/151;G06F40/279;G06N3/04;G06N3/08 |
代理公司: | 北京丰浩知识产权代理事务所(普通合伙) 11781 | 代理人: | 李学康 |
地址: | 100083 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多模态特征提取与融合的语音情感识别方法,首先对输入的音频提取eGeMAPS声学特征集,该特征集定义了88个基本的语音情感分析特征,并规范化了对低层次声学特征的操作方法,解决了可解释性差的问题;其次,本发明提供了一种对用户特征以及音频内容文本特征进行提取的方法,并用层次自注意力将用户特征以及文本特征与声学特征进行融合,充分利用语料数据库中的多模态信息,对语音情感进行更加全面的建模,由此更加有效地实现语音情感识别;最后,本发明利用一种层次化的自注意力机制将多模态特征进行深度融合,以及将不同模态的特征在同一高维语义空间里对齐,增强了情感表述能力,从而提高了语音情感识别的准确率。 | ||
搜索关键词: | 基于 多模态 特征 提取 融合 语音 情感 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第十五研究所;北京间微科技有限责任公司,未经中国电子科技集团公司第十五研究所;北京间微科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110100299.8/,转载请声明来源钻瓜专利网。