[发明专利]基于HMM和PNN的语音识别方法、装置及存储介质在审
申请号: | 201811148728.3 | 申请日: | 2018-09-29 |
公开(公告)号: | CN108831447A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 董家仁;刘广聪 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/16;G10L15/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音信号 隐马尔科夫模型 概率神经网络 目标语音信号 存储介质 语音识别 语音识别装置 神经网络 语音 | ||
本发明公开了一种基于HMM和PNN的语音识别方法,首先获取语音信号并对语音信号进行处理,得到目标语音信号,利用隐马尔科夫模型对目标语音信号进行第一识别,得到最优识别序列,利用概率神经网络对最优识别序列进行第二识别,得到语音信号的识别结果。因此,采用本方案,将隐马尔科夫模型和概率神经网络两者结合对语音信号进行识别,能避免单一的HMM模型或神经网络带来的局限性而带来的对语音的识别精确度较低的问题。此外,本发明还公开了一种基于HMM和PNN的语音识别装置、设备及存储介质。
技术领域
本发明涉及计算机技术领域,特别涉及一种基于HMM和PNN的语音识别方法、装置及存储介质。
背景技术
随着科学技术的发展,人和机器的交流越来越多,为了使机器能够理解人类的语音,并作出相应的反应,语音识别具备了广阔的应用前景。目前,在语音识别领域应用较成熟的是隐马尔科夫模型,应用隐马尔科夫模型对语音进行识别时,其识别效率较高。隐马尔科夫模型是一种统计模型,用来描述具有隐含未知参数的从一个状态到另一个状态的转移过程,可以通过观测向量序列状态对该模型的状态进行观察,其中,每一个观测向量都是具有某种概率密度分布的状态分量产生,而又都通过某种概率分布表现为各种状态。
应用隐马尔科夫模型对语音进行识别时,是通过马尔科夫链的不同状态对语音信号的形成过程进行描述,存储不同状态下对应的概率输出、循环运算获取模型参数,通过该算法求出不同模型的条件概率和条件概率最大值相应的语音即为识别结果,虽然隐马尔科夫模型能很好的对连续语音进行处理,但是对于静态语音信号,隐马尔科夫模型并不能很好的进行识别。而神经网络在并行处理和分类的问题上表现出了极大的优势,这得益于神经网络极强的输入输出映射能力,在大词汇量连续语音识别中,在噪声环境下语音识别率会大幅降低。因此,采用单一的HMM模型或者神经网络对语音进行识别时,由于单一的HMM模型或神经网络的局限性,导致对语音的识别精确度较低。
因此,如何提高对语音进行识别的精确度是本领域技术人员需要解决的问题。
发明内容
本发明的目的在于提供一种基于HMM和PNN的语音识别方法、装置及存储介质,提高了语音进行识别的精确度。
为实现上述目的,本发明实施例提供了如下技术方案:
第一,本发明实施例提供了一种基于HMM和PNN的语音识别方法,包括:
获取语音信号并对所述语音信号进行处理,得到目标语音信号;
利用隐马尔科夫模型对所述目标语音信号进行第一识别,得到最优识别序列;
利用预先建立的概率神经网络对所述最优识别序列进行第二识别,得到所述语音信号的识别结果。
优选的,所述利用隐马尔科夫模型对所述目标语音信号进行第一识别,得到最优识别序列包括:
提取所述目标语音信号的语音信号特征;
将所述语音信号特征作为所述隐马尔科夫模型的输入;
利用所述隐马尔科夫模型对所述语音信号特征进行识别,得到所述最优识别序列。
优选的,所述利用预先建立的概率神经网络对所述最优识别序列进行第二识别,得到所述语音信号的识别结果包括:
对所述最优识别序列进行归一化,得到待识别特征矩阵;
将所述待识别特征矩阵作为所述概率神经网络的输入,
计算所述待识别特征矩阵和与样本语音对应的标准特征矩阵中的各元素的匹配概率,得到多个匹配概率;
将各所述匹配概率中与最大匹配概率对应的目标元素作为所述识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811148728.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于生成样本的方法和装置
- 下一篇:语音控制智能设备的方法、装置及存储介质