[发明专利]面向多源信息领域的说话人自适应语音情感识别方法在审
申请号: | 201710975296.2 | 申请日: | 2017-10-16 |
公开(公告)号: | CN107895582A | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | 张昕然;袁林;王贤哲;贲兴龙;韩国辉;刘格;丁頠洋 | 申请(专利权)人: | 中国电子科技集团公司第二十八研究所 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L21/0208;G10L21/0216;G10L15/14 |
代理公司: | 南京苏高专利商标事务所(普通合伙)32204 | 代理人: | 常虹 |
地址: | 210003 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 信息 领域 说话 自适应 语音 情感 识别 方法 | ||
技术领域
本发明属于多媒体信息处理领域,具体涉及一种说话人自适应语音情感识别方法。
背景技术
语音情感识别(SER)可以为人机交互(HCI)提供一个自然基本的交界渠道,其中的基本要素是说话人和使用的语言。在公开来源的信息领域中会涉及到多源音频数据,而由于人类情感的复杂性,实时收集到的测试数据往往与预先收集到的训练样本存在不匹配情况。这里,说话人产生的差异就是一个重要的因素。不同的说话人情感表达的习惯有很大的不同,当说话人来自不同的年龄组,国家,性别时,此问题尤为突出。因此,依赖说话人进行情感识别的系统通常比说话人独立的系统更可靠。
常见的说话人特性自适应方案是在SER系统的特征优化阶段进行,在对其特征进行自适应的过程中,模型参数不改变,而对特征向量进行补偿。在SER进行建模和识别之前,先将语音信号映射到特征空间。说话人不匹配会导致测试样本服从一个与训练样本不同的概率分布。然后,进行说话人模型自适应的步骤。该阶段是当最优化特征被分入目标模型附近的一个更宽的情感类别区域时进行的。这样会导致因说话人特质改变而造成的误判。
发明内容
发明目的:针对现有技术中存在的问题,本发明公开了一种面向多源信息领域的说话人自适应语音情感识别方法,从前置特征提取和特征集优化两个角度实施处理,有效控制语音信息系统的情感分类稳定度。
技术方案:本发明采用如下技术方案:
面向多源信息领域的说话人自适应语音情感识别方法,包括如下步骤:
(1)获取多源语音情报语料,对所述多源语音情报语料进行语音增强处理;
(2)对步骤(1)处理后的语音情报提取情感特征;
(3)对提取的情感特征建立说话人自适应高斯混合模型;
(4)采用EM算法对说话人自适应高斯混合模型的参数进行估计;
(5)利用所述说话人自适应高斯混合模型对多源语音情报预料进行聚类,得到语音情感分类识别结果。
所述语音增强处理为加性噪声消除、回声消除或增益调节。
加性噪声消除采用谱减法,具体步骤为:
(S1-1.1)在语音信号的无声段对噪声谱进行估计,获取噪声的频谱分布;
(S1-1.2)对含噪语音利用STFT将时域波形转换成混合频散曲线,计算出傅里叶系数后在其中进行谱减法,将噪声频谱的振幅从总体STFT的振幅系数中移除;
(S1-1.3)使用ISTFT将处理过的语音帧系数转化到时域,获取消除了加性噪声的语音情报。
回声消除采用盲反褶积过滤器,滤波后的语音信号zt计算如下:
zt=yt-cyt-τ
其中yt为回声消除前的语音情报,c为滤波器系数,τ是延迟常数。
本发明使用最大似然方法估计系数c,似然函数为:
L(θ)=∑logp(yt|yt-T;θ)。
增益调节包括如下步骤:
(S1-2.1)计算滤波器每个通道的功率的峰值QP(n,l):
QP(n,l)=max(λtQP(n-1,l),Q0(n,l))
其中n为语音帧序号,l为通道序号,λt为遗忘因子,Q0(n,l)为第n帧第l通道的初始包络功率;
(S1-2.2)时域掩蔽后的输出为:
其中,μt=0.2;
(S1-2.3)整个非对称去噪过程的传输函数可以表示为
其中R(n,l)为非对称滤波模块的子带信号输出,Q(n,l)为整个非对称去噪过程的数学表达;
经过传输函数S(n,l)调制后的功率谱为
T(n,l)=P(n,l)S(n,l)
其中P(n,l)为增益调节过程的子带功率;
(S1-2.4)通过滑动平均的方式计算第n帧平均功率η(n):
其中,λη取0.999,η(n)的初始值由训练数据计算得到,L为通道总数,则归一化的功率为:
所述步骤(3)对提取的情感特征建立说话人自适应高斯混合模型为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十八研究所,未经中国电子科技集团公司第二十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710975296.2/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置