[发明专利]基于深度神经网络模型的带噪语音端点检测方法及装置在审
申请号: | 202110478661.5 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113327633A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 詹瑾;赵慧民;黄科乔 | 申请(专利权)人: | 广东技术师范大学 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L25/30;G10L15/16;G10L15/04 |
代理公司: | 广东广盈专利商标事务所(普通合伙) 44339 | 代理人: | 李俊 |
地址: | 510630 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 神经网络 模型 语音 端点 检测 方法 装置 | ||
本发明公开了一种基于深度神经网络模型的带噪语音端点检测方法及装置,其中,所述方法包括:获得带噪语音信息数据;对于所述带噪语音信息数据进行预处理,获得预处理后的带噪语音信息数据;对所述预处理后的带噪语音信息数据进行小波变换处理,获得小波变换后的带噪语音信息数据;基于所述小波变换后的带噪语音信息数据进行能量熵计算,获得能量熵计算结果;基于所述能量熵计算结果进行能量熵特征矩阵的构建,获得能量熵特征矩阵;将所述能量熵特征矩阵输入预设的深度神经网络模型中进行端点检测识别处理,输出端点检测识别结果。在本发明实施例中,可以快速的检测出带噪语音信息数据中的语音段和非语音段,并且具有较高的识别率。
技术领域
本发明涉及语音识别检测技术领域,尤其涉及一种基于深度神经网络模型的带噪语音端点检测方法及装置。
背景技术
随着智能技术的发展,语音识别、语音分析、语音压缩及语音合作等技术领域的发展和应用,对语音信号中的处理要求越来越高,所需要的的计算复杂度也越来越多,因此需要在进行相关语音处理的时候,首先对识别带噪语音信息中的语音段和非语音段,现有技术中,一般通过短时能量法、过零率检测法等方式进行识别,但是识别速度较慢,并且识别准确率不高,无法满足后续的语音处理的要求。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种基于深度神经网络模型的带噪语音端点检测方法及装置,可以快速的检测出带噪语音信息数据中的语音段和非语音段,并且具有较高的识别率。
为了解决上述技术问题,本发明实施例提供了一种基于深度神经网络模型的带噪语音端点检测方法,所述方法包括:
获得带噪语音信息数据;
对于所述带噪语音信息数据进行预处理,获得预处理后的带噪语音信息数据;
对所述预处理后的带噪语音信息数据进行小波变换处理,获得小波变换后的带噪语音信息数据;
基于所述小波变换后的带噪语音信息数据进行能量熵计算,获得能量熵计算结果;
基于所述能量熵计算结果进行能量熵特征矩阵的构建,获得能量熵特征矩阵;
将所述能量熵特征矩阵输入预设的深度神经网络模型中进行端点检测识别处理,输出端点检测识别结果。
可选的,所述获得带噪语音信息数据,包括:
基于预设的麦克风设备进行语音信息采集处理,获得带噪语音信息数据;或,接收用户输入的方式获得带噪语音信息数据。
可选的,所述对于所述带噪语音信息数据进行预处理,获得预处理后的带噪语音信息数据,包括:
基于汉明窗函数对所述带噪语音信息数据进行加窗处理,获得加窗处理结果;
对所述加窗处理结果进行按照预设分帧规则进行分帧处理,获得预处理后的带噪语音信息数据。
可选的,所述对所述预处理后的带噪语音信息数据进行小波变换处理,获得小波变换后的带噪语音信息数据,包括:
获得用于小波变换的分解过程中的分解层数;
基于所述分解层数对所述预处理后的带噪语音信息数据进行小波变换处理,获得小波变换后的带噪语音信息数据。
可选的,所述获得用于小波变换的分解过程中的分解层数,包括:
基于所述预处理后的带噪语音信息数据的语音信噪比;
基于所述语音信噪比获得用于小波变换的分解过程中的分解层数。
可选的,所述基于所述小波变换后的带噪语音信息数据进行能量熵计算,获得能量熵计算结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东技术师范大学,未经广东技术师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110478661.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光连接设备及局域网路系统
- 下一篇:一种自组网与多路传输结合的勤务系统