[发明专利]远场语音识别处理方法及装置有效
申请号: | 201610917557.0 | 申请日: | 2016-10-20 |
公开(公告)号: | CN106328126B | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 江巍;关海欣;苏牧;张军 | 申请(专利权)人: | 北京云知声信息技术有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/20;G10L15/06;G10L25/51 |
代理公司: | 北京尚伦律师事务所 11477 | 代理人: | 张俊国 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种远场语音识别处理方法及装置,该方法包括:接收远场语音;将所述远场语音输入到预先训练得出的基于神经网络的语音训练模型中;通过所述语音训练模型中包含的远场语音和近场语音的音频特征,对接收到的远场语音的音频特征进行去干扰处理,得到处理后的远场语音;对处理后的远场语音进行识别。该方法能够实现对远场语音的优化处理,获取到较佳的处理结果且降低了设备成本投入。 | ||
搜索关键词: | 语音 识别 处理 方法 装置 | ||
【主权项】:
1.一种远场语音识别处理方法,其特征在于,包括:接收远场语音;将所述远场语音输入到预先训练得出的基于神经网络的语音训练模型中;通过所述语音训练模型中包含的远场语音和近场语音的音频特征,对接收到的远场语音的音频特征进行去干扰处理,得到处理后的远场语音;对处理后的远场语音进行识别;其中,基于神经网络的语音训练模型的训练过程,包括:录入近场语音,从录入的近场语音中获取近场音频特征;在近场语音中加入远场语音的环境声音,得到模拟远场语音;将近场语音和模拟远场语音加入神经网络中进行训练,得到基于神经网络的语音训练模型;将近场语音和模拟远场语音加入神经网络中进行训练时,采用中低层网络特定训练的目标函数进行语音模型训练,具体包括:采用如下公式最小化整个数据库的重建向量和纯净向量的平方误差损失:
U是训练事件的总数量;zi是第i个重建特征向量;xi是对应的纯净特征向量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云知声信息技术有限公司,未经北京云知声信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610917557.0/,转载请声明来源钻瓜专利网。