[发明专利]基于神经网络的语音端点检测方法、装置、设备及介质有效
| 申请号: | 202011309613.5 | 申请日: | 2020-11-20 |
| 公开(公告)号: | CN112489677B | 公开(公告)日: | 2023-09-22 |
| 发明(设计)人: | 郑振鹏;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L25/87;G10L25/51;G10L25/03 |
| 代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 涂年影 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 神经网络 语音 端点 检测 方法 装置 设备 介质 | ||
本申请涉及语音检测技术领域,揭露一种基于神经网络的语音端点检测方法、装置、设备及介质,其中方法包括对样本语音文件进行声学特征提取,对每帧语音特征进行分配上下文特征信息,得到特征矩阵,通过神经网络模型对特征矩阵进行特征处理,得到一维特征向量,并对一维特征向量进行语音帧的序列信息进行学习处理,得到预测值;计算预测值与真实语音值的损失函数值,并根据损失函数值更新神经网络模型的网络参数,再通过训练好的神经网络模型输出待检测语音文件的预测结果。本申请还涉及区块链技术,样本语音文件存储于区块链中。本申请通过结合上下文特征信息,训练神经网络模型,有利于提高神经网络的语音端点检测的准确度。
技术领域
本申请涉及语音检测技术领域,尤其涉及一种基于神经网络的语音端点检测方法、装置、设备及介质。
背景技术
语音端点检测(Voice Activity Detection)是语音处理的一个重要部分。准确的语音端点检测不仅可以减少语音信号处理的计算量,提高系统的实时性,而且可以提高语音系统的鲁棒性及后续语音系统的准确性。但实际环境中,存在背景噪声过大,这给语音端点检测的检测结果带来了巨大挑战。所以一个准确的语音端点检测系统具有重要意义。
现有的语音端点检测模型只能利用固定的上下文信息,不能根据上下文的语音情况自适应的选择最优的上下文信息。这使得当使用较长的上下文信息时,语音端点检测模型会存在输入过多噪音情况,造成端点检测异常;当使用较短的上下文信息则不能更好的利用语音的上下文信息,进行语音端点的正确判断。这导致了现有技术无法提供较为准确的语音端点检测,现亟需一种能够提高语音端点检测准确度的方法。
发明内容
本申请实施例的目的在于提出一种基于神经网络的语音端点检测方法、装置、设备及介质,以提高语音端点检测的准确度。
为了解决上述技术问题,本申请实施例提供一种基于神经网络的语音端点检测方法,包括:
获取样本语音文件,并对所述样本语音文件进行声学特征提取,得到语音特征,其中,所述语音特征包含特征信息;
对每帧所述语音特征进行分配N帧上下文特征信息,得到特征矩阵,其中,N为正整数;
通过神经网络模型对所述特征矩阵进行特征处理,得到一维特征向量,并对所述一维特征向量进行语音帧的序列信息的学习处理,得到预测值;
计算所述预测值与真实语音值的损失函数值,并根据所述损失函数值更新神经网络模型的网络参数,得到训练好的神经网络模型;
获取待检测的语音文件,并对所述待检测的语音文件进行声学特征提取,得到待检测的语音文件的语音特征;
将所述待检测的语音文件的语音特征输入到所述训练好的神经网络模型中,得到预测结果。
为了解决上述技术问题,本申请实施例提供一种基于神经网络的语音端点检测装置,包括:
语音特征提取模块,用于获取样本语音文件,并对所述样本语音文件进行声学特征提取,得到语音特征,其中,所述语音特征包含特征信息;
特征矩阵获取模块,用于对每帧所述语音特征进行分配N帧上下文特征信息,得到特征矩阵,其中,N为正整数;
预测值获取模块,用于通过神经网络模型对所述特征矩阵进行特征处理,得到一维特征向量,并对所述一维特征向量进行语言帧的序列信息进行学习处理,得到预测值;
神经网络模型训练模块,用于计算所述预测值与真实语音值的损失函数值,将所述损失函数值更新神经网络模型的网络参数,得到训练好的神经网络模型;
声学特征信息提取模块,用于获取待检测的语音文件,并对所述待检测的语音文件进行声学特征提取,得到声学特征信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011309613.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钢板切割设备
- 下一篇:一种基于信用的支持数据包交换的比例公平调度方法





