[发明专利]一种异常声音检测方法及异常声音检测装置有效
申请号: | 201811561607.1 | 申请日: | 2018-12-20 |
公开(公告)号: | CN111354366B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 曲道奎;杜威;王海鹏;王晓东;沈露;卢裕 | 申请(专利权)人: | 沈阳新松机器人自动化股份有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/03;G10L25/24;G10L25/51;G10L25/60 |
代理公司: | 沈阳科苑专利商标代理有限公司 21002 | 代理人: | 许宗富 |
地址: | 110168 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 异常 声音 检测 方法 装置 | ||
1.一种异常声音检测方法,其特征在于,包括以下步骤:
步骤一,建立音频库;建立正常音频特征标准库和异常音频特征标准库;
步骤二,采集分析音频信号;采集待测音频信号,去除噪声,获取有效待测音频信号;抽取有效待测音频信号的待测音频特征参数;
步骤三,快速判定异常声音;将待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比,判定是否需要进一步执行异常声音准确判定;
若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值小于预设阈值,则输出待测音频信号为正常音频信号的结果;
若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值大于预设阈值,则进行异常声音准确判定;
步骤四,进行异常声音准确判定;使用正常声音数据特征和异常声音数据特征训练一个基于分层结构的分类模型,如果分类模型准确率能够达到预先设定的指标,则认为分类模型训练完成;
将待测音频特征参数输入训练好的分类模型进行异常声音判定;
若判定结果为异常音频信号,则输出当前待测音频信号为异常信号;
若判定结果为正常音频信号,则输出当前待测音频信号为正常信号。
2.根据权利要求1所述的异常声音检测方法,其特征在于,采集待测音频信号后,去除噪声,通过待测音频信号的短时能量和平均过零率,判断待测音频信号是否为有效待测音频信号;然后获取有效待测音频信号。
3.根据权利要求1所述的异常声音检测方法,其特征在于,所述待测音频特征参数、标准音频特征参数和异常音频特征参数为:通过提取待测音频信号的梅尔倒谱系数、梅尔倒谱系数一阶导数、小波变换系数、能量值、过零率和傅里叶系数,并利用Gaussian进行参数拟合,获取的音频数据的均值和方差。
4.根据权利要求3所述的异常声音检测方法,其特征在于,所述待测音频特征参数的KL散度与标准音频特征参数的KL散度差值计算公式为:
KL(P,Q)=1/2(KL(P,Q)+KL(Q,P));
其中,KL散度的计算公式为KL(P,Q)=∑[P(x)log(P(x)/Q(x))]。
5.根据权利要求1所述的异常声音检测方法,其特征在于,所述基于分层结构的分类模型为,特征信号输入至第一分类层,该层分类方法包括支持向量机、奇异值分解的组合,经第一层分类后的特征,结合原始特征,共同作为第二层分类器的输入特征值,第二层分类器使用支持向量机进行分类。
6.根据权利要求2所述的异常声音检测方法,其特征在于,采集待测音频信号后,将待测音频信号分为10ms为一帧的声音片段,计算每帧的短时能量和过零率,使用两级判别法进行有效声音的端点检测,进而获取有效待测音频信号。
7.根据权利要求3所述的异常声音检测方法,其特征在于,所述梅尔倒谱系数使用13维度作为特征参数,并使用15ms作为一帧数据,利用Gaussian进行参数拟合,获取音频数据的均值和方差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳新松机器人自动化股份有限公司,未经沈阳新松机器人自动化股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811561607.1/1.html,转载请声明来源钻瓜专利网。