[发明专利]一种减弱语音识别中说话人影响的方法有效
| 申请号: | 201810257420.6 | 申请日: | 2018-03-27 |
| 公开(公告)号: | CN108492821B | 公开(公告)日: | 2021-10-22 |
| 发明(设计)人: | 涂志强;梁亚玲;杜明辉 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/16;G10L15/26 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 刘巧霞 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 减弱 语音 识别 说话 人影 方法 | ||
本发明公开了一种减弱语音识别中说话人影响的方法,具体步骤为:(1)获取实验数据,对实验数据按照提供的默认划分方式进行划分;(2)对数据进行基本声学特征提取;(3)对步骤(2)所得的最终特征进行基准语音识别系统训练;(4)对步骤(2)得到的最终特征进行说话人扰动信息提取器的训练;(5)进行带说话人扰动信息提取器的语音识别系统的训练;(6)获取实验结果。本发明无需收集用户样本就能提升基准系统的识别性能,而且本发明对任一用户都能保持一致的识别性能提升。
技术领域
本发明涉及语音识别领域,尤其涉及一种减弱语言识别中说话人影响的方法。
背景技术
语音信号是一种复杂的信号,即使同一个人重复说同样一句话,表现出来的声学特性也会有所差异;而不同说话人说同一句话,表现出来的声学特性的差异往往会更大;而这往往会降低语音识别系统的性能,而且,当用户的语音样本未出现在语音识别系统的训练集中时,识别性能往往会进一步降低;所以,在语音识别任务中,SI(说话人无关)系统的识别性能往往不如SD(说话人相关)系统的识别性能;而要建一个真正意义上的SD系统,则需要特定说话人的大量语音样本,这往往是不现实的;因此,减弱说话人的影响是提升语音识别系统性能的有效手段。
目前,主流的方法是先建一个SI系统,在收集用户的一些语音样本后,使用SA(说话人自适应)技术来调整SI系统的参数,以适应该用户,提升系统对该用户的识别性能;其中,SA技术主要包括MLLR(Maximum Likelihood Linear Regression)和EIGENVOICES技术。但是,该方法存在着两大局限:1、需要先收集用户的一些语音样本,而这会降低用户体验;2、在现实生活中,往往很难保证系统的使用者只有一个人;当使用SA技术对用户A进行适应后,系统对用户B的识别性能往往会下降;若对每个用户都采用SA技术进行适应,则会有多套系统参数,一方面将增加系统存储,另一方面,还需要搭建一个说话人识别系统来判断当前使用者是哪个用户,以选择相应的系统参数,这会使整个系统变得很复杂,而且说话人识别系统也不能做到100%的识别准确率。
发明内容
本发明的目的在于提供一种减弱语音识别中说话人影响的方法,本发明通过神经网络来搭建一个iEx(说话人扰动信息的提取器),从语音中提取出说话人扰动信息后,直接减去该扰动信息,以此来减弱说话人的影响,提升系统的识别性能。
一种减弱语音识别中说话人影响的方法,具体步骤包括:
(1)获取实验数据,对实验数据按照提供的默认划分方式进行划分;
(2)对数据进行基本声学特征提取;
(3)对步骤(2)所得的最终特征进行baseSys(基准语音识别系统)训练,具体为:
(3.1)利用卷积神经网络和门控循环神经网络搭建baseSys;
(3.2)将步骤(2)所得的最终特征送入baseSys进行模型训练;
(4)将步骤(2)所得的最终特征进行iEx的训练;
(5)将步骤(2)所得的最终特征进行finalSys(带说话人扰动信息提取器的语音识别系统)的训练;
(6)获取最终实验结果。
进一步地,所述步骤(1)的数据划分采用数据提供的默认划分方式进行划分,其中验证集和测试集各占全部数据的10%左右,剩下的80%作为训练集。
进一步地,所述步骤(2)的具体步骤包括:
(2.1)采用melspectrogram函数提取fbank(梅尔滤波器组)特征,设置函数参数;
(2.2)对fbank特征取自然对数以进行同态信号处理,即把特征中的乘性分量转化为加性分量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810257420.6/2.html,转载请声明来源钻瓜专利网。





