[发明专利]一种语音识别方法及装置有效
申请号: | 201611127924.3 | 申请日: | 2016-12-09 |
公开(公告)号: | CN108615525B | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 高莹莹 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/22 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王花丽;张颖玲 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 | ||
本发明公开了一种语音识别方法及装置,所述方法包括:确定待识别语音;对所述待识别语音进行声学特征提取;将提取的声学特征输入解码器;通过解码器调用训练的语言模型和训练的声学模型对所述提取的声学特征进行识别,得到识别结果;其中,所述声学模型采用深度神经网络‑隐马尔可夫模型DNN‑HMM,且在训练所述DNN‑HMM的过程中,将说话人身份确认与音素后验概率的学习作为两个并行任务添加到DNN‑HMM的输出层;通过解码器输出所述识别结果。
技术领域
本发明涉及电子技术,尤其涉及一种语音识别方法及装置。
背景技术
语音识别技术,是将语音信号转换为计算机可识别的文字符号,解决让机器听懂人说话问题的技术。语音识别技术在电话、会议、客服等复杂环境中英语识别正确率在80%左右,离人类2%至4%的错误率还有很大距离。事实上,目前语音识别技术在以下多个方面具有缺陷:1)对自然语言的识别和理解。首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则。事实上,人类的语音浩如烟海,语义妙不可言,有些正常的人之间的交流都有2%至4%的错误率,更何况是设备。2)语音信息量大。语音模式不仅对不同的说话人不同,对同一说话人也是不同的,例如,一个说话人在随意说话和认真说话时的语音信息是不同的,另外,一个人的说话方式随着时间也会有变化。3)语音的模糊性。说话者在讲话时,不同的词可能听起来是相似的,这一点在英语和汉语中较为常见,例如,当一个人说汉语拼音“feiji”,那么“feiji”可能是斐济、飞机和肥鸡等。4)单个字母或词、字的语音特性受上下文的影响,以致改变了重音、音调、音量和发音速度等。5)环境噪声和干扰对语音识别有严重影响,致使识别率低。6)音频处理技术有限,人耳能清晰分别的两个发音,其声学特征对语音识别引擎来说可能几乎是相同的。
由于目前的语音识别技术存在以上可以缺点,从而导致语音识别的准确率不高,无法满足用户对准确率的要求;虽然目前有些语音识别的准确率能够满足人们对准确率的要求,但是语音识别的参数、模型的复杂度都会大幅度提高,从而导致产品成本的提高,进而用户如果为了提高语音识别的准确性将需要额外支付很多的费用。
发明内容
有鉴于此,本发明实施例为解决现有技术中存在的至少一个问题而提供一种语音识别方法及装置,能够在简化声学模型复杂度的前提下而提高语音识别准确率,进而提高用户体验。
本发明实施例的技术方案是这样实现的:
第一方面,本发明实施例提供一种语音识别方法,所述方法包括:
确定待识别语音;
对所述待识别语音进行声学特征提取;
将提取的声学特征输入解码器;
通过解码器调用训练的语言模型和训练的声学模型对所述提取的声学特征进行识别,得到识别结果;其中,所述声学模型采用深度神经网络-隐马尔可夫模型DNN-HMM,且在训练所述DNN-HMM的过程中,将说话人身份确认与音素后验概率的学习作为两个并行任务添加到DNN-HMM的输出层。
通过解码器输出所述识别结果。
第二方面,本发明实施例提供一种语音识别装置,所述装置包括确定单元、提取单元、输入单元和解码器,其中:
所述确定单元,用于确定待识别语音;
所述提取单元,用于对所述待识别语音进行声学特征提取;
所述输入单元,用于将提取的声学特征输入解码器;
所述解码器,用于调用训练的语言模型和训练的声学模型对所述提取的声学特征进行识别,得到识别结果并输出所述识别结果;其中,所述声学模型采用深度神经网络-隐马尔可夫模型DNN-HMM,且在训练所述DNN-HMM的过程中,将说话人身份确认与音素后验概率的学习作为两个并行任务添加到DNN-HMM的输出层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团公司,未经中国移动通信有限公司研究院;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611127924.3/2.html,转载请声明来源钻瓜专利网。