[发明专利]一种基于MFCC谱变换的多对象语音识别方法在审

专利信息
申请号: 202211572894.2 申请日: 2022-12-08
公开(公告)号: CN115762483A 公开(公告)日: 2023-03-07
发明(设计)人: 崔家正;董昊;姜晓宇 申请(专利权)人: 辽宁石油化工大学
主分类号: G10L15/02 分类号: G10L15/02;G10L25/18;G10L25/24;G10L25/45;G10L15/06;G10L21/0316
代理公司: 暂无信息 代理人: 暂无信息
地址: 113001 辽宁省抚*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 mfcc 变换 对象 语音 识别 方法
【说明书】:

发明公开了一种基于MFCC谱变换的多对象语音识别方法,通过设置多个麦克风阵列和计算多个对象的相对皮尔逊相关系数实现在多对象环境下的语音识别与区分,并通过梅尔谱变换的方法提取目标语音的特征参数,能够提高语音识别系统在多语音对象场景下的语音识别精度和效率。

技术领域

本发明属于语音识别技术领域,尤其涉及一种基于MFCC谱变换的多对象语音识别方法。

背景技术

随机模型法目前应用较为成熟,该方法主要采用提取特征、训练模板、对模板进行分类及对模板进行判断的步骤来对语音进行识别。该方法涉及到的技术一般有3种:动态时间规整(DTW),隐马尔科夫模型(HMM)理论和矢量量化(VQ)技术。其中,HMM算法相较于其他两者的优点是简便优质,在语音识别性能方面更为优异。因此,如今大部分语音识别系统都在使用隐马尔科夫模型算法。

在语音识别场景中,通常会涉及多个语音对象的对话环境,在多对象环境下需要对有效的及符合要求的语音信息进行过滤选取,同时大部分语音对象的发音与样本标准有一定偏差,这会严重影响语音识别系统在多对象环境下的识别精度和效率。因此,需要设计一种面对多个语音对象环境的、识别精度较高的语音识别方法。

发明内容

鉴于此,本发明提供了一种基于MFCC谱变换的多对象语音识别方法,以消除或改善现有技术中的一个或多个缺陷,解决现有技术在多对象环境下语音识别精度不高的问题。

实现本发明目的的技术解决方案为:

本发明提供了一种基于MFCC谱变换的多对象语音识别方法,其特征在于,所述方法包括:

通过大量说话人的语音数据作为样本训练生成一个高斯混合模型,并从标准语音样本中提取标准梅尔倒谱系数;

通过麦克风阵列中的多个麦克风分别获取多个对象的待识别语音音频,并对所述多个对象的声源进行声源区分定位,得到每个语音对象与其他对象的相对距离;

通过得到的对象之间的相对距离确定每个对象的相对皮尔逊相关系数,根据每一对象的相对皮尔逊相关系数,以最小二乘法确定极点麦克风和极轴麦克风;

结合待识别音频中每个对象的语音定位与相对极点麦克风的信号强度,对语音音频中的多个对象进行音频声源区分;

对区分的声源信息的语音数据加入汉宁窗函数,并将数据的每帧进行区分,然后进行快速傅里叶变换,得到每帧语音信号的频率幅度谱;

对变换后的幅度谱进行梅尔滤波,取对数,然后进行离散余弦变换,得到MFCC非线性谱变换后的梅尔倒谱系数作为目标语音的特征参数。

在一些实施例中,所述以最小二乘法确定极点麦克风和极轴麦克风的方法包括:

取基于最小二乘法的多个麦克风的相对皮尔逊相关系数最小值所对应的声源对象作为所述极点麦克风;

取所述相对皮尔逊相关系数最小的极点麦克风所对应的其他对象作为极轴麦克风。

在一些实施例中,所述梅尔滤波的方法为:设置一组26个三角滤波器作为梅尔滤波器组,对所求得的功率谱进行滤波。

本发明提供的一种基于MFCC谱变换的多对象语音识别方法,与现有技术相比,具有以下优点:能够通过利用多组麦克风确定多对象语音环境的声源数据,并确定各对象的相对皮尔逊相关系数,根据皮尔逊相关系数从麦克风阵列中确定极点麦克风和极轴麦克风,能够有效地实现语音音频的对象区分;通过对训练样本进行谱变换和梅尔滤波能够更好地提高语音识别的识别精度。

本发明的附加优点、目的,以及特征将在下面的描述中将部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本发明的实践而获知。本发明的目的和其它优点可以通过在书面说明及其权利要求书以及附图中具体指出的结构实现到并获得。

本领域技术人员将会理解的是,能够用本发明实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本发明能够实现的上述和其他目的。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁石油化工大学,未经辽宁石油化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211572894.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top