[发明专利]一种音频检测方法及装置、存储介质在审
申请号: | 202010514720.5 | 申请日: | 2020-06-08 |
公开(公告)号: | CN111782860A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 白金;严锋贵 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G06F16/65 | 分类号: | G06F16/65;G06N3/04;G06N3/08;G10L25/03;G10L25/30;G10L25/51 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张静;张颖玲 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 检测 方法 装置 存储 介质 | ||
1.一种音频检测方法,其特征在于,所述方法包括:
获取待检测音频数据,并将待检测音频数据输入神经网络分类器中,利用所述神经网络分类器中的神经网络对所述待检测音频数据进行处理,得到预设音频分类标签对应的一组分类结果数据;
利用所述神经网络分类器中的分类模型对所述一组分类结果数据进行处理,得到所述一组分类结果数据对应的一组概率值,并从所述一组概率值中确定出概率值最大的第一概率值;
查找并输出所述第一概率值对应的第一音频分类标签,以完成对所述待检测音频数据的音频检测过程。
2.根据权利要求1所述的方法,其特征在于,所述将待检测音频数据输入神经网络中,利用所述神经网络分类器中的神经网络对所述待检测音频数据进行处理,得到预设音频分类标签对应的一组分类结果数据之前,所述方法还包括:
获取所述预设音频分类标签对应的训练分类音频数据;
利用所述训练分类音频数据,对初始神经网络分类器进行训练,得到所述神经网络分类器。
3.根据权利要求2所述的方法,其特征在于,所述获取所述预设音频分类标签对应的训练分类音频数据,包括:
按照所述预设音频分类标签,将训练音频数据进行分类,得到多组训练音频数据,所述多组训练音频数据的组别数量与所述预设音频分类标签的标签数量相同;
按照预设数据增量策略,对所述多组训练音频数据的数据量进行调整,得到多组增量训练音频数据;
利用声道特征提取模型,从所述多组增量训练音频数据中提取数据特征;
根据所述数据特征和所述预设音频分类标签,得到所述训练分类音频数据。
4.根据权利要求2所述的方法,其特征在于,所述利用所述训练分类音频数据,对初始神经网络分类器进行训练,得到所述神经网络分类器,包括:
将所述训练分类音频数据输入初始神经网络分类器中,利用所述初始神经网络分类器中的初始神经网络对所述训练分类音频数据进行处理,得到所述预设音频分类标签对应的训练分类结果数据,所述预设音频分类标签的标签数量和所述训练分类结果数据的结果数量相同;
利用所述初始神经网络分类器中的初始分类模型对所述训练分类结果数据进行处理,得到输出分类标签;
根据所述预设音频分类标签和所述输出分类标签,对所述初始神经网络和初始分类模型进行训练,得到所述神经网络分类器。
5.根据权利要求2所述的方法,其特征在于,所述预设数据增量策略包括:数据延时、数据缩小、数据放大、数据剪切、数据移位、声音均衡处理中的至少一种。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述神经网络为:深度神经网络DNN、卷积神经网络CNN、长短期记忆网络LSTM、门控循环神经网络GRU中的任一种。
7.根据权利要求3所述的方法,其特征在于,所述声道特征提取模型包括:线性预测倒谱系数LPCC、梅尔频率倒谱系数MFCC、频谱图中的任一种。
8.根据权利要求1所述的方法,其特征在于,所述获取待检测音频数据,包括:
从待测设备获取上行音频数据,所述上行音频数据为所述待测设备通过收音端进行录音产生的音频数据;
和/或从所述待测设备获取下行音频数据,所述下行音频数据为所述待测设备通过发音端播放的音频数据;
将所述上行音频数据和/或所述下行音频数据确定为所述待检测音频数据。
9.根据权利要求1或8所述的方法,其特征在于,所述获取待检测音频数据之后,所述将待检测音频数据输入神经网络分类器中之前,所述方法还包括:
对所述待检测音频数据进行特征提取,得到待检测特征数据;
相应的,所述将待检测音频数据输入神经网络分类器中,利用所述神经网络分类器中的神经网络对所述待检测音频数据进行处理,得到预设音频分类标签对应的一组分类结果数据,包括:
将所述待检测特征数据输入神经网络分类器中,利用所述神经网络对所述待检测特征数据进行处理,得到所述一组分类结果数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010514720.5/1.html,转载请声明来源钻瓜专利网。