[发明专利]一种基于迁移神经网络声学模型的语音识别系统及方法有效
| 申请号: | 201810077556.9 | 申请日: | 2018-01-23 |
| 公开(公告)号: | CN110070855B | 公开(公告)日: | 2021-07-23 |
| 发明(设计)人: | 张鹏远;刘丹阳;徐及;颜永红 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02 |
| 代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;杨青 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及一种基于迁移神经网络声学模型的语音识别系统及方法,该系统包括:信号处理及特征提取模块、语言模型、解码器和迁移神经网络声学模型;其中迁移神经网络声学模型包括鲁棒神经网络和定向神经网络;本系统通过对鲁棒神经网络模型的模型参数进行固定,同时通过神经网络间的层间横向连接,将鲁棒声学模型的信息传递到目标声学模型中,不仅保留了原鲁棒声学模型的性能,同时还对目标语言做特定的优化。解决了低资源语言的鲁棒声学模型的快速构建的问题,通过利用数据充分的语言的声学模型进行模型参数迁移的方式,来提升目标低资源语言的声学模型性能以及训练的收敛速度。 | ||
| 搜索关键词: | 一种 基于 迁移 神经网络 声学 模型 语音 识别 系统 方法 | ||
【主权项】:
1.一种基于迁移神经网络声学模型的语音识别系统,其特征在于,包括:信号处理及特征提取模块,用于对待识别的音频信号进行增强,将所述待识别的音频信号从时域转化到频域,并提取声学特征;声学模型,用于以提取的声学特征为输入,生成声学模型得分;所述声学模型为迁移神经网络声学模型,包括:前端的鲁棒神经网络声学模型和后端的定向神经网络声学模型;所述鲁棒神经网络声学模型作为一个所述定向神经网络声学模型的辅助模型,使用大量源语言数据进行训练;语言模型,用于估计通过重训练语料学习词之间的相互概率,输出语言模型得分;解码器,用于根据给定的待识别音频信号的特征向量序列、所述声学模型得分和所述语言模型得分,将总体输出分数较高的词序列作为识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810077556.9/,转载请声明来源钻瓜专利网。





