[发明专利]基于CDAR模型的跨库语音情感识别方法及装置在审
| 申请号: | 202211010154.X | 申请日: | 2022-08-23 |
| 公开(公告)号: | CN115497508A | 公开(公告)日: | 2022-12-20 |
| 发明(设计)人: | 宗源;连海伦;郑文明;常洪丽;路成;唐传高;赵焱 | 申请(专利权)人: | 东南大学 |
| 主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L15/02;G10L15/06;G10L15/08;G10L15/16 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 冯艳芬 |
| 地址: | 211102 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 cdar 模型 语音 情感 识别 方法 装置 | ||
本发明公开了一种基于CDAR模型的跨库语音情感识别方法及装置,方法包括:(1)获取两个语音情感数据库,分别作为训练数据库和测试数据库,(2)从训练数据库和测试数据库中提取具有相同情感类别标签的语音样本,分别作为源域样本和目标域样本,并提取源域样本和目标域样本的IS09特征作为样本特征;(3)建立协同分布适配回归CDAR模型,(4)利用交替方向法和非精确增广拉格朗日乘子求解CDAR模型,得到投影矩阵U的最优值(5)对于待识别语音,提取IS09特征,并采用学习到的投影得到对应的情感类别。本发明识别准确率更高。
技术领域
本发明涉及语音情感识别技术,尤其涉及一种基于CDAR模型的跨库语音情感识别方法及装置。
背景技术
语音是人类日常生活中交流情感信息最自然的行为之一。因此,语音情感识别(Speech Emotion Recognition,SER)的研究在情感计算、模式识别和语音信号处理领域得到了广泛的关注,它使计算机能够从语音信号中获得自动理解快乐、恐惧和悲伤等情绪状态的能力。在过去的几十年里,人们提出了许多性能良好的SER方法,并在广泛使用的语音情感数据库上取得了良好的性能。然而,现有的SER方法离实际可用还很远。其中一个主要原因是这些SER方法在实践中没有考虑训练和测试语音信号可能来自不同数据库的场景。在这种情况下,由于数据库的差异,如不同的录音设备和环境,不同的语言,训练语音信号和测试语音信号之间不可避免地存在明显的特征分布不匹配。因此,原有的SER方法在单个语音数据库上的性能会大幅下降。这就产生了一个具有挑战性的SER任务,即跨库的SER。从形式上讲,在跨库SER任务中,训练数据库样本的情感标签是给定的,而目标数据库样本的情感标签是完全不可用的。需要从给定的源标签信息中学习分类器来预测未标记的测试语音样本的情绪。现有技术识别准确率有待提高。
发明内容
发明目的:本发明针对现有技术存在的问题,提供一种识别准确率更高的基于CDAR模型的跨库语音情感识别方法及装置。
技术方案:本发明所述的基于CDAR模型的跨库语音情感识别方法包括:
(1)获取两个语音情感数据库,分别作为训练数据库和测试数据库,其中,训练数据库包括若干语音样本和对应的情感类别标签,测试数据库仅包括语音样本:
(2)从训练数据库和测试数据库中提取具有相同情感类别标签的语音样本,分别作为源域样本和目标域样本,并提取源域样本和目标域样本的IS09特征作为样本特征;
(3)建立CDAR模型,具体为:
式中,U是待学习得到的投影矩阵,表示源域所有样本的样本特征形成的特征矩阵,d为特征矩阵的维数,ns为源域样本数,表示源域所有样本的情感类别标签矩阵,表示目标域所有样本的样本特征形成的特征矩阵,nt为目标域样本数,λ、μ是权衡参数,c为情感类别总数,cr为粗粒度情感类别总数,分别表示源域、目标域中属于第i类情感的语音样本的特征矩阵,分别表示源域、目标域中属于第j类粗粒度情感的语音样本的特征矩阵,1s,1t,和都是值为1的向量,维度分别为ns、nt、分别为源域、目标域中属于第i类情感的语音样本的数目,分别表示源域、目标域中属于第j类粗粒度情感的语音样本的数目,若干个情感类别可以归类为一类粗粒度情感类别;
(4)利用交替方向法和非精确增广拉格朗日乘子求解CDAR模型,得到投影矩阵U的最优值
(5)对于待识别语音,提取IS09特征,并采用学习到的投影得到对应的情感类别。
进一步的,步骤(4)具体包括:
(4-1)初始化投影矩阵U;
(4-2)根据投影矩阵U按照采用下式预测所有目标域样本的情感类别标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211010154.X/2.html,转载请声明来源钻瓜专利网。





