[发明专利]一种减弱语音识别中说话人影响的方法有效

专利信息
申请号: 201810257420.6 申请日: 2018-03-27
公开(公告)号: CN108492821B 公开(公告)日: 2021-10-22
发明(设计)人: 涂志强;梁亚玲;杜明辉 申请(专利权)人: 华南理工大学
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L15/16;G10L15/26
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 刘巧霞
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 减弱 语音 识别 说话 人影 方法
【说明书】:

发明公开了一种减弱语音识别中说话人影响的方法,具体步骤为:(1)获取实验数据,对实验数据按照提供的默认划分方式进行划分;(2)对数据进行基本声学特征提取;(3)对步骤(2)所得的最终特征进行基准语音识别系统训练;(4)对步骤(2)得到的最终特征进行说话人扰动信息提取器的训练;(5)进行带说话人扰动信息提取器的语音识别系统的训练;(6)获取实验结果。本发明无需收集用户样本就能提升基准系统的识别性能,而且本发明对任一用户都能保持一致的识别性能提升。

技术领域

本发明涉及语音识别领域,尤其涉及一种减弱语言识别中说话人影响的方法。

背景技术

语音信号是一种复杂的信号,即使同一个人重复说同样一句话,表现出来的声学特性也会有所差异;而不同说话人说同一句话,表现出来的声学特性的差异往往会更大;而这往往会降低语音识别系统的性能,而且,当用户的语音样本未出现在语音识别系统的训练集中时,识别性能往往会进一步降低;所以,在语音识别任务中,SI(说话人无关)系统的识别性能往往不如SD(说话人相关)系统的识别性能;而要建一个真正意义上的SD系统,则需要特定说话人的大量语音样本,这往往是不现实的;因此,减弱说话人的影响是提升语音识别系统性能的有效手段。

目前,主流的方法是先建一个SI系统,在收集用户的一些语音样本后,使用SA(说话人自适应)技术来调整SI系统的参数,以适应该用户,提升系统对该用户的识别性能;其中,SA技术主要包括MLLR(Maximum Likelihood Linear Regression)和EIGENVOICES技术。但是,该方法存在着两大局限:1、需要先收集用户的一些语音样本,而这会降低用户体验;2、在现实生活中,往往很难保证系统的使用者只有一个人;当使用SA技术对用户A进行适应后,系统对用户B的识别性能往往会下降;若对每个用户都采用SA技术进行适应,则会有多套系统参数,一方面将增加系统存储,另一方面,还需要搭建一个说话人识别系统来判断当前使用者是哪个用户,以选择相应的系统参数,这会使整个系统变得很复杂,而且说话人识别系统也不能做到100%的识别准确率。

发明内容

本发明的目的在于提供一种减弱语音识别中说话人影响的方法,本发明通过神经网络来搭建一个iEx(说话人扰动信息的提取器),从语音中提取出说话人扰动信息后,直接减去该扰动信息,以此来减弱说话人的影响,提升系统的识别性能。

一种减弱语音识别中说话人影响的方法,具体步骤包括:

(1)获取实验数据,对实验数据按照提供的默认划分方式进行划分;

(2)对数据进行基本声学特征提取;

(3)对步骤(2)所得的最终特征进行baseSys(基准语音识别系统)训练,具体为:

(3.1)利用卷积神经网络和门控循环神经网络搭建baseSys;

(3.2)将步骤(2)所得的最终特征送入baseSys进行模型训练;

(4)将步骤(2)所得的最终特征进行iEx的训练;

(5)将步骤(2)所得的最终特征进行finalSys(带说话人扰动信息提取器的语音识别系统)的训练;

(6)获取最终实验结果。

进一步地,所述步骤(1)的数据划分采用数据提供的默认划分方式进行划分,其中验证集和测试集各占全部数据的10%左右,剩下的80%作为训练集。

进一步地,所述步骤(2)的具体步骤包括:

(2.1)采用melspectrogram函数提取fbank(梅尔滤波器组)特征,设置函数参数;

(2.2)对fbank特征取自然对数以进行同态信号处理,即把特征中的乘性分量转化为加性分量;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810257420.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top