[发明专利]一种基于功率谱Gabor特征序列递归模型的语音识别方法有效

专利信息
申请号: 201710292486.4 申请日: 2017-04-28
公开(公告)号: CN107103913B 公开(公告)日: 2020-02-04
发明(设计)人: 卜起荣;张晓;冯筠;曹正文 申请(专利权)人: 西北大学
主分类号: G10L25/21 分类号: G10L25/21;G10L21/0208;G10L15/10
代理公司: 61216 西安恒泰知识产权代理事务所 代理人: 李婷;张明
地址: 710069 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 功率 gabor 特征 序列 递归 模型 语音 识别 方法
【说明书】:

发明公开了一种基于功率谱Gabor特征序列递归模型的语音识别方法,该方法的基本步骤包括:1.对语音输入信号进行预处理;2.分别提取功率谱特征和动态谱Delta特征;3.利用时空Gabor滤波器对频谱特征进行滤波处理,并且通过PCA降维处理得到语音特征序列;4.根据语音特征序列,构造递归图;5.通过对语音递归模型进行距离检测,完成语音识别。本发明通过对语音信号进行预处理,经过特征提取得到语音特征序列,然后将语音特征序列转化为递归模型进行相似性检测,有效的解决了目前自动语音识别系统在非稳态噪声、低信噪比等复杂情况下识别率不够理想、性能容易恶化的问题,提高了语音识别算法的鲁棒性。

技术领域

本发明属于语音识别技术领域,涉及一种复杂背景下的语音识别方法,具体涉及一种基于功率谱Gabor特征序列递归模型的语音识别方法。

背景技术

语音作为最自然便捷的交流方式,一直是人机通信和交互领域最重要的研究之一,自动语音识别(ASR)更是实现人机交互尤为关键的技术。经过多年的研究,ASR已经走进我们的生活,语音转录、自动翻译、手机助手等都是典型的代表。但是这些系统大都依赖他们所处的声学环境,鲁棒性不强。

现有的语音识别包含两个阶段:其一,语音特征提取研究,其二,分类器设计研究。传统的特征提取方法,如梅尔倒谱系数(MFCC)、感知线性预测(PLP)等在复杂环境下难以提取有效的特征;而且传统的分类算法在识别过程中难以达到理想的效果,如动态时间规整(DTW)距离、支持向量机(SVM)等。因为语音识别的匹配需要解决的一个关键问题是说话人对同一个词的两次发音不可能完全相同,而且两次发音特征提取后的特征维度也不同,使用传统识别方法难以取得理想的效果。神经网络又受困于需要大样本的标注数据训练,小样本情况下,容易过拟合等问题,使其难以提供有效的方案。

发明内容

针对上述现有技术中存在的问题,本发明的目的在于,提供一种基于功率谱Gabor特征序列递归模型的语音识别方法,通过对语音信号进行预处理,经过特征提取得到语音特征序列,然后将语音特征序列转化为递归图进行相似性检测,有效的解决了目前自动语音识别系统在非稳态噪声、低信噪比等复杂情况下识别率不够理想、性能容易恶化的问题,从而提高语音识别算法的鲁棒性。

为了实现上述任务,本发明采用以下技术方案:

一种基于功率谱Gabor特征序列递归模型的语音识别方法,包括以下步骤:

步骤一,语音信号的预处理

对获取的语音信号进行端点检测,分离并去除语音信号中的噪声信息,获得语音信号中的有效部分,并求其功率谱;

步骤二,提取功率谱Gabor特征序列

步骤2.1,根据所述的功率谱,提取所述的有效部分的功率归一化频谱特征;

步骤2.2,将所述的功率归一化频谱特征按照帧索引顺序组成一个序列C,然后分别进行一阶差分和二阶差分处理后,分别得到Delta频谱特征和Double Delta频谱特征;

步骤2.3,将所述的功率归一化频谱特征、Delta频谱特征以及Double Delta频谱特征组成功率归一化频谱特征集,然后通过时空Gabor滤波,将时间调制滤波器表示为行向量,与功率归一化频谱特征集的每个通道独立地卷积;同样,频域调制滤波器表示为列向量,与功率归一化频谱特征集的每个帧独立地卷积;

步骤2.4,针对所述的功率归一化频谱特征集,执行直方图均衡化,然后通过PCA将高维特征投影到低维空间上,得功率谱Gabor特征集,并将功率谱Gabor特征集组成语音特征序列X;

步骤三,构建语音特征序列的递归图

将语音特征序列X按照如下公式计算其递归图r:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710292486.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top