[发明专利]一种语音识别方法有效
申请号: | 202211250643.2 | 申请日: | 2022-10-13 |
公开(公告)号: | CN115331658B | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 姜晓琳;刘炳展;徐萌;王秀翠;杜玉霞;朱佳;王亮亮 | 申请(专利权)人: | 山东商业职业技术学院;高寻真源(山东)教育科技有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/06;G10L15/16;G10L15/18 |
代理公司: | 北京中索知识产权代理有限公司 11640 | 代理人: | 商金婷 |
地址: | 250102 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 | ||
本发明公开一种语音识别方法,应用于语音信号处理领域;解决的技术问题是语音识别,采用的技术方案是一种语音识别方法,包括:(S1)语音识别设备设置识别主题语言;(S2)语音识别设备接收语音信息,并将语音信息存储在语音识别设备中;(S3)采用DTW算法提取语音信息语义模板,与语音识别词典的参考模板进行匹配;(S4)模板匹配成功,语音识别设备的显示器显示语音识别结果;本发明大大提高了语音识别的准确性,提高了人与人之间的沟通能力。
技术领域
本发明涉及语音信息处理领域,且更确切地涉及一种语音识别方法。
背景技术
智能照明语音控制系统具有高效、节能、便捷、成本低廉等优点,在智能照明系统中得以迅速发展。由于智能照明声控信号的间歇性、非线性和非平稳性,且易受噪声干扰,使得不同人同一个命令的声控信号具有较大的相似性,难以对身份进行正确识别;同一个人同一个命令的声控信号具有较大的不一致性,难以对语义进行正确和快速识别。规定的若干人若干个命令的声控信号具有较大的随机性,难以适应场合的扩展和变化,这对智能照明语音控制系统推广应用带来了很大难度。因此,声控信号的身份与语义识别的正确、效率和泛化一直是重要的研究环节之一。
现有技术中采用一种基于听觉特性的声纹识别方法,通过大量的机器学习统计音频内容特征并进行分类处理。然而,该方法需要大量的音频信号波段样本训练,计算量过大导致智能音频设备识别音频内容出现混乱,检索精度较低。另一种解决方案是基于卷积神经网络和深度循环网络的音频内容分析系统,采用人工智能云存储方法在计算过程中进行缓存,避免了识别音频内容混乱现象,但该方法存在一定的计算冗余。
发明内容
针对上述问题,本发明公开一种语音识别方法,能够进行语音识别,实现语音数据的分析与处理,提高了语音识别能力。
为了实现上述技术效果,本发明采用以下技术方案:
一种语音识别方法,其特征在于:所述方法包括:
(S1)通过语音识别设备设置识别主题语言;
其中语音识别设备采用CN3704芯片进行语音识别信息控制,语音识别设备包括识别语言设置单元、语音识别处理单元、语音按钮、麦克风和显示器;
(S2)语音识别设备接收语音信息,并将语音信息存储在语音识别设备中;
其中语音识别设备通过语音按钮开启语音识别设备,采用麦克风接收语音信息,并将语音信号转换为电信号存储在语音识别设备的语音识别处理单元中;
(S3)采用DTW算法提取语音信息语义模板,与语音识别词典的参考模板进行匹配;
其中通过DTW算法按语音帧进行标记语音信息所有片段,得到语音信息的语义模板表示为,表示语音帧的标记序数,表示语义模板中第帧的特征矢量值;采用欧氏距离的方法计算语义模板与参考模板之间的最优距离,将语音信息的语义模板与语音识别词典中的所有参考模板一一匹配,则计算取最小匹配失真度为:
(8)
式(8)中,表示参考模板对应的最小匹配失真度;表示语音信息语义模板与参考模板之间的距离;若小于语音识别阈值,则模板匹配成功,输出参考模板的语义为语音信息识别结果;
(S4)模板匹配成功,语音识别设备的显示器显示语音识别结果;
其中,若
作为对本技术方案的进一步限定,在步骤(S3)中,语音识别词典的训练方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东商业职业技术学院;高寻真源(山东)教育科技有限公司,未经山东商业职业技术学院;高寻真源(山东)教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211250643.2/2.html,转载请声明来源钻瓜专利网。