[发明专利]一种高情感区分度的语音特征提取方法有效
申请号: | 201710822706.X | 申请日: | 2017-09-13 |
公开(公告)号: | CN107564543B | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 肖仲喆;陶智;陈颖;张晓俊;吴迪 | 申请(专利权)人: | 苏州大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/27;G10L25/03;G10L25/18 |
代理公司: | 南京中高专利代理有限公司 32333 | 代理人: | 徐福敏 |
地址: | 215006*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种高情感区分度的语音特征提取方法,包括:进行常规的语谱图提取,即对语音信号分帧后,对各帧数据进行离散傅里叶变换DFT,以频谱幅度值作为灰度值,得到语谱图。对语谱图进行预滤波后,进行稀疏化处理,提取其最高若干条能量峰值曲线,并对所提取的曲线结果进行频率位置信息去除,仅保留其幅度,以消除语音内容的影响,然后进行第二层离散傅里叶变换,生成语音二重谱,可以保留具有高情感区分度的信息。本发明解决了现有技术中在语音识别过程中,语音信息部分细节信息被淹没,同时由于语音特征中包含大量与语音内容有关的信息而造成情感区分度有限的技术问题。 | ||
搜索关键词: | 一种 情感 区分 语音 特征 提取 方法 | ||
【主权项】:
一种高情感区分度的语音特征提取方法,其特征在于,包括以下步骤:步骤一、从语音信号中提取语谱图STG(i,k),i为时间轴序号,k为设定的第一频率f1的轴序号;步骤二、对语谱图STG(i,k)进行稀疏化处理,取语谱图中峰值位置幅度最大的v个峰值位置,并将这些峰值点沿时域方向形成峰值轨迹;步骤三、对峰值轨迹位置进行差分运算,得到v‑1个频率差分值,以投票方式确定各次谐波间频率差Dh(i),计算各次谐波在设定邻域内的均值,组合成前v次谐波强度轨迹,以去除语音内容的影响,设定q为谐波次数,q=1,2,…v;步骤四、设置第二频率f2的分辨率,确定第二级傅立叶变换的计算点数N2,计算第q条谐波强度轨迹的第二频率频谱,将v条强度轨迹的第二频率频谱去除相位,仅保留幅度谱,并拼合为去除了内容影响的语音二重谱;步骤五、设定第二频率f2的对应离散频率编号阈值为lf2,其对应的分割阈值频率为:tf2=200N2·lf2]]>设定第一频率f1归一化后的第一阈值频率tf11和第二阈值频率tf12,在第一频率f1和第二频率f2构建的坐标系中划分如下4个区域,其中:区域1:区域2:区域3:区域4:l为第二频率f2离散后的序号,根据划分好的4个区域,分别计算各区域内语音二重谱的均值和标准差作为语音情感识别特征,将计算得出的8个特征输入情感语音识别模型模块中训练学习,得到语音中的情感信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710822706.X/,转载请声明来源钻瓜专利网。