[发明专利]一种高情感区分度的语音特征提取方法有效
申请号: | 201710822706.X | 申请日: | 2017-09-13 |
公开(公告)号: | CN107564543B | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 肖仲喆;陶智;陈颖;张晓俊;吴迪 | 申请(专利权)人: | 苏州大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/27;G10L25/03;G10L25/18 |
代理公司: | 南京中高专利代理有限公司 32333 | 代理人: | 徐福敏 |
地址: | 215006*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 情感 区分 语音 特征 提取 方法 | ||
本发明公开了一种高情感区分度的语音特征提取方法,包括:进行常规的语谱图提取,即对语音信号分帧后,对各帧数据进行离散傅里叶变换DFT,以频谱幅度值作为灰度值,得到语谱图。对语谱图进行预滤波后,进行稀疏化处理,提取其最高若干条能量峰值曲线,并对所提取的曲线结果进行频率位置信息去除,仅保留其幅度,以消除语音内容的影响,然后进行第二层离散傅里叶变换,生成语音二重谱,可以保留具有高情感区分度的信息。本发明解决了现有技术中在语音识别过程中,语音信息部分细节信息被淹没,同时由于语音特征中包含大量与语音内容有关的信息而造成情感区分度有限的技术问题。
技术领域
本发明涉及语音识别技术领域,特别是一种高情感区分度的语音特征提取方法。
背景技术
随着语音处理、语音识别等技术的快速发展,语音情感识别以及富含情感信息的语音合成技术逐渐成为语音信号处理、情感计算、多媒体检索等众多领域中共同的重要研究方向。这一研究方向的研究目的之一是能够从语音中进行情感信息的自动提取,以便实现广播/电视自动选台,热线电话根据情绪状态分类转接,或极端工作环境下异常情绪监测等任务。
语音特征是在语音情感识别研究中的关键环节之一,从情感计算这一方向兴起至今一直都是本领域的研究热点,而语音特征的情感区分度决定了其在情感语音识别中的有效性。现有的用于语音情感识别中的特征来自于传统语音识别以及说话人识别中的语音参数,即包括体现语音频谱结构的基频、共振峰参数,语音短时能量参数,体现人耳听觉特性的MFCC(Mel Frequency Cepstrum Coefficients,梅尔频率倒谱系数)等参数,以这些参数在音素、音节、词、短语等级别上的统计值作为语音情感识别参数,如图1所示。
这些参数对语音情感有一定程度的区分度,但是一方面,基于统计的长时特征在计算过程中有可能造成部分细节信息被淹没;另一方面,继承于语音识别等领域的参数,如基频、共振峰等,包含大量与语音内容有关的信息,情感区分度有限,成为近年来语音情感识别性能遭遇瓶颈的原因之一。因此,具有高情感区分度的语音细节特征成为本领域的重要需求。
发明内容
针对上述技术问题,本发明中提出了一种高情感区分度的语音特征提取方法,该方法基于语谱图稀疏化信息提取的语音二重谱特征参数,用于对语音情感进行区分。首先,进行常规的语谱图提取,即对语音信号分帧后,对各帧数据进行离散傅里叶变换(DFT),以频谱幅度值作为灰度值,得到语谱图。对语谱图进行预滤波后,进行稀疏化处理,提取其最高若干条能量峰值曲线,并对所提取的曲线结果进行频率位置信息去除,仅保留其幅度,以消除语音内容的影响,然后进行第二层离散傅里叶变换,生成语音二重谱,可以保留具有高情感区分度的信息。本发明解决了现有技术中在语音识别过程中,语音信息部分细节信息被淹没,同时由于语音特征中包含大量与语音内容有关的信息而造成情感区分度有限的技术问题。
为了实现根据本发明的这些目的和其它优点,提供了一种高情感区分度的语音特征提取方法,包括以下步骤:
步骤一、从语音信号中提取语谱图STG(i,k),i为时间轴序号,k为设定的第一频率f1的轴序号;
步骤二、对语谱图STG(i,k)进行稀疏化处理,取语谱图中峰值位置幅度最大的v个峰值位置,并将这些峰值点沿时域方向形成峰值轨迹;
步骤三、对峰值轨迹位置进行差分运算,得到v-1个频率差分值,以投票方式确定各次谐波间频率差Dh(i),计算各次谐波在设定邻域内的均值,组合成前v次谐波强度轨迹,以去除语音内容的影响,设定q为谐波次数,q=1,2,…v;
步骤四、设置第二频率f2的分辨率,确定第二级傅立叶变换的计算点数N2,计算第q条谐波强度轨迹的第二频率频谱,将v条强度轨迹的第二频率频谱去除相位,仅保留幅度谱,并拼合为去除了内容影响的语音二重谱;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710822706.X/2.html,转载请声明来源钻瓜专利网。