[发明专利]一种情感特征提取方法在审
申请号: | 201910296711.0 | 申请日: | 2019-04-14 |
公开(公告)号: | CN110060697A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 李剑峰 | 申请(专利权)人: | 湖南检信智能科技有限公司 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L21/0264;G10L25/24;G10L25/63 |
代理公司: | 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 | 代理人: | 郑自群 |
地址: | 410000 湖南省长沙市高新开*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感特征提取 抗噪能力 语音序列 预加重 采样 语音 | ||
本发明公开了一种情感特征提取方法,包括:对语音中的一帧采样,对语音序列s(n)实行预加重然后做离散FFT变换,再逐步计算得到MFCC参数。本发明在任何条件下都可以使用MFCC参数,在抗噪能力上MFCC参数具有很强的处理能力,增强了抗噪能力。
技术领域
本发明涉及情感分析技术领域,更为具体地,涉及一种情感特征提取方法。
背景技术
特征参数提取是为了对语音信号进行分析处理,语音情感识别系统主要提取以短时谱为基础的各种表征,反映人耳听觉特性的MEL频率倒谱系数(MFCC)。Mel频率倒谱系数(MFCC)表示的核心思想是把人的听觉系统对频率感知的非线性特征用于语音识别特征中,具体地说,在50Hz以下的低频段,人耳对频率感知是线性的;在50Hz以上频段,人耳对频率感知呈现对数非线性。Mel频率倒谱参数(MFCC)就是充分利用了人耳对这种频段的感知特性的参数。通过临界带宽的度量方法可以采用Mel刻度,MFCC是将信号频谱的频率轴转换换为Mel刻度,所谓的Mel频率尺度,它的值大体上对应于实际频率的对数分布关系。Mel频率与实际频率的关系式,倒谱系数是通过倒谱域的转换得到的。现有的特征提取技术,存在抗噪特性差等问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种情感特征提取方法,在任何条件下都可以使用提取的MFCC参数,在抗噪能力上MFCC参数具有很强的处理能力,因此增强了特质提取过程中的抗噪能力。
本发明的目的是通过以下技术方案来实现的:
一种情感特征提取方法,包括:
(1)对语音序列s(n)实行预加重然后做离散FFT变换;
(2)对语音中的一帧采样{xi}i=1,2,…,M,M是帧长,对{xi}i=1,2,…,M加汉明窗后作M点的FFT,频域分量{Xi}i=1,2,…,M通过时域信号进行转化,离散功率谱S(n)通过取模的平方得到;
(3)计算S(n)通过传递函数Hm(n)求得功率值,即计算S(n)和Hm(n)的乘积再求和,求得M个参数Pm;
(4)计算Pm的自然对数,求得Lm;
(5)计算Lm的离散余弦变换,求得Dm;
(6)去除直流成分的D0,取D1,D2,…,Dk作为MFCC参数。
进一步的,在步骤(1)中,通过传递函数为H(Z)=1-αZ-1的滤波器对其加以滤波,其中α为预加重系数且0.9<α<10,设n时刻的语音采样值为X(n),经过预加重处理后的结果为Y(n)=X(n)-αX(n-1),0.9<α<1.0。
进一步的,在步骤(1)中,k=12。
进一步的,在步骤(1)中,语音中的一帧采样,为了计算FFT方便,取n=256点。
本发明的有益效果是:
(1)本发明在任何条件下都可以使用MFCC参数,在抗噪能力上MFCC参数具有很强的处理能力,增强了抗噪能力。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南检信智能科技有限公司,未经湖南检信智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910296711.0/2.html,转载请声明来源钻瓜专利网。