[发明专利]一种减弱语音识别中说话人影响的方法有效
| 申请号: | 201810257420.6 | 申请日: | 2018-03-27 |
| 公开(公告)号: | CN108492821B | 公开(公告)日: | 2021-10-22 |
| 发明(设计)人: | 涂志强;梁亚玲;杜明辉 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/16;G10L15/26 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 刘巧霞 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种减弱语音识别中说话人影响的方法,具体步骤为:(1)获取实验数据,对实验数据按照提供的默认划分方式进行划分;(2)对数据进行基本声学特征提取;(3)对步骤(2)所得的最终特征进行基准语音识别系统训练;(4)对步骤(2)得到的最终特征进行说话人扰动信息提取器的训练;(5)进行带说话人扰动信息提取器的语音识别系统的训练;(6)获取实验结果。本发明无需收集用户样本就能提升基准系统的识别性能,而且本发明对任一用户都能保持一致的识别性能提升。 | ||
| 搜索关键词: | 一种 减弱 语音 识别 说话 人影 方法 | ||
【主权项】:
1.一种减弱语音识别中说话人影响的方法,其特征在于,具体步骤包括:(1)获取实验数据,对实验数据按照提供的默认划分方式进行划分;(2)对数据进行基本声学特征提取;(3)对步骤(2)所得的最终特征进行基准语音识别系统训练,具体为:(3.1)利用卷积神经网络和门控循环神经网络搭建基准语音识别系统;(3.2)将步骤(2)所得的最终特征送入基准语音识别系统进行模型训练;(4)将步骤(2)所得的最终特征进行说话人扰动信息提取器的训练;(5)将步骤(2)所得的最终特征进行带说话人扰动信息提取器的语音识别系统的训练;(6)获取最终的实验结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810257420.6/,转载请声明来源钻瓜专利网。





