[发明专利]语音识别方法及装置有效
申请号: | 201710198565.9 | 申请日: | 2017-03-29 |
公开(公告)号: | CN106991999B | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 万韶华 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L25/30 |
代理公司: | 北京尚伦律师事务所 11477 | 代理人: | 代治国 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开是关于一种语音识别方法及装置。该方法包括获取语音识别模型中待输入深度神经网络DNN第i层网络的M个语音数据,每个语音数据包括语音的持续时间、语音频率和语音强度;对M个语音数据包括的M个语音强度进行正则化处理,获取M个正则语音数据,每个正则语音数据包括语音的持续时间、语音频率和正则语音强度;根据M个正则语音数据,获取输入DNN第i层网络的M个输入语音数据。该技术方案中,通过对待输入DNN网络中第i层网络的语音数据进行正则化处理,并根据正则化后的语音数据获取第i层网络的输入语音数据,提高了DNN网络的训练速度,降低了输入的语音数据中声音强度对语音识别的影响,进而提高了语音识别的准确率。 | ||
搜索关键词: | 语音 识别 方法 装置 | ||
【主权项】:
一种语音识别方法,其特征在于,包括:获取语音识别模型中待输入深度神经网络DNN第i层网络的M个语音数据,每个所述语音数据包括语音的持续时间、语音频率和语音强度;所述i为大于或等于1的整数;对所述M个语音数据包括的M个语音强度进行正则化处理,获取M个正则语音数据,每个所述正则语音数据包括语音的所述持续时间、所述语音频率和正则语音强度,所述M为大于或等于1的整数;根据所述M个正则语音数据,获取输入所述DNN第i层网络的M个输入语音数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710198565.9/,转载请声明来源钻瓜专利网。