[发明专利]一种语音识别中的特征参数提取方法有效

专利信息
申请号: 201210102804.3 申请日: 2012-04-10
公开(公告)号: CN102646415A 公开(公告)日: 2012-08-22
发明(设计)人: 张晓俊;陶智;肖仲喆;吴迪;季晶晶 申请(专利权)人: 苏州大学
主分类号: G10L15/02 分类号: G10L15/02;G10L19/02
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 楼高潮
地址: 215000 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种语音识别中的特征参数提取方法,将数字语音样本采用低通滤波器和高通滤波器进行分割,低通滤波器滤波后的信号采用基于人耳听觉特性的巴克滤波器组方法提取巴克频率倒谱参数,并进行规整化处理;高通滤波器滤波后的信号采用非线性动力学的最大李雅普诺夫参数来描述;所述一种语音识别中的特征参数提取方法包括巴克频率倒谱系数参数的提取和最大李雅普诺夫参数的提取两个步骤。本发明采用低通滤波器和高通滤波器进行分割,使处理之后的信号更加符合人类的听觉特性,从而能够提取出性能更优秀的语音特征参数。
搜索关键词: 一种 语音 识别 中的 特征 参数 提取 方法
【主权项】:
1.一种语音识别中的特征参数提取方法,其特征在于:将数字语音样本采用低通滤波器和高通滤波器进行分割,低通滤波器滤波后的信号采用基于人耳听觉特性的巴克滤波器组方法提取巴克频率倒谱参数,并进行规整化处理;高通滤波器滤波后的信号采用非线性动力学的最大李雅普诺夫参数来描述,其具体做法如下:    a.巴克频率倒谱参数的提取,包括以下步骤:步骤1)选择巴克域子波母函数为:,其中;可得听觉感知域下的函数表达式:;其中,b代表听觉感知频率,听觉感知频率带宽为[b1,b2];的平移步长;步骤2)再引入特劳恩米勒所给出的线性频率与听觉感知频率之间的函数关系:;步骤3)代入上式,就得到线性频率下的听觉感知子波函数的表达式: ;为规整因子,可近似认为常数,取0.2;步骤4)将语音能量计算出以后通过巴克滤波器组:,随后通过能量对数的离散余弦变换提取出巴克频率倒谱参数;    b.最大李雅普诺夫参数的提取采用wolf法,包括以下步骤:步骤1)对语音时间序列采用虚假邻点法确定重构维数,平均互信息法确定延迟时间间隔,重构相空间,相点数为;步骤2)以初始相点为基点,在点集中除外的其余点中选取一个与最近的点作为端点,构成初始向量,间欧氏距离可记为;步骤3)时间步长或演化时间,初始向量沿轨线向前演化得到一新向量,其相应基点与端点间欧氏距离可记为,在相应时段内系统线度指数增长率记为:;步骤4)如此继续,直至所有相点,然后取各指数的增长率的平均值为最大李雅普诺夫指数估计值:;    c.统一特征化,包括以下步骤:步骤1)提取低频部分的巴克频率倒谱参数加上其一阶差分,巴克频率倒谱系数+△巴克频率倒谱系数共24阶,分别求取每阶参数的均值和方差,进行排列;    步骤2)提取高频部分的最大李雅普诺夫参数,取其前50帧。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210102804.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top