[发明专利]基于MF‑PLPCC特征的工程机械声音识别方法在审
申请号: | 201710060595.3 | 申请日: | 2017-01-25 |
公开(公告)号: | CN106992011A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 曹九稳;曹敏;王建中 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/21;G10L25/48;G10L19/04 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙)33240 | 代理人: | 杜军 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 mf plpcc 特征 工程机械 声音 识别 方法 | ||
技术领域
本发明是属于声音识别技术领域,涉及到基于声音的梅尔感知线性预测倒谱系数(MF-PLPCC)对工程机械的识别方法。
背景技术
随着我国经济的快速发展,基础设施建设也在加快,而在基础设施建设的工程施工过程中工程机械早已取代了大部分的体力劳动。在高速公路、机场铁路建设、水利设施、城市改造等工地,我们都可以看到挖掘机、推土机等工程机械。然而在施工过程中,监管不到位,从而导致工程机械出现瞎施工、乱施工、重复施工等乱象,浪费国家资源的同时也增加了工程成本。由于监管不到位而出现的这些乱象,本发明提出了一种识别方法对工程机械的识别,从而实现了对工程机械的监控。
基于声音的工程机械的识别方法有多种,例如:线性预测倒谱系数 (LPCC)、感知线性预测倒谱系数(PLPCC)、梅尔倒谱系数(MFCC)结合分类器等识别方法。这些方法在近距离或者信噪比高的情况下能够反映声音的大部分信息,对工程机械的识别率可能很高,但是在远距离或者信噪比低的情况下提取工程机械声音的特征量较少,从而降低了识别率。
发明内容
针对目前存在如上所述的技术问题,本发明提供了一种基于 MF-PLPCC特征对工程机械声音识别方法。这种识别方法是基于Mel频率、听感强度和线性预测倒谱系数的混合特征,通过RELM实现对工程机械的识别分类。该方法能够更好地模拟人的听觉系统,在远距离或者信噪比低的情况下,能够提取工程机械声音的特征量比传统方法较多,使得识别率有所提高。
为了实现上述目的,本发明采取的技术方案包括以下步骤:
步骤1、采集工程机械作业时候的声音和周围环境噪声,并将采集的声音信号建立声音样本库;
步骤2、对声音样本库中所有的声音信号进行预加重、分帧和加窗处理;
步骤3、求出经过步骤2处理后的每帧声音信号的短时能量谱;
步骤4、基于短时能量谱求出通过Mel三角滤波器组的短时能量;
步骤5、用立方根对短时能量进行强度-响度转换;
步骤6、对转换后的信号采用傅里叶逆变换转换到时域中;
步骤7、求出时域中信号的线性预测系数;
步骤8、基于线性预测系数计算倒谱系数,即所求的声音特征;
步骤9、对不同机械的声音特征进行标号,建立样本特征库;
步骤10、基于训练样本特征库,利用正则化极限学习机建立模型;
步骤11、重复步骤1-步骤8,对目标声音进行MF-PLPCC特征提取;
步骤12、利用正则化极限学习机对提取的目标声音特征和步骤10 建立的模型进行匹配,然后得出分类结果;
步骤13、根据分类结果,判断目标声音是哪种机械在作业或者是周围噪。
所述的步骤2对采集的声音信号作预加重,具体的:设声音信号为 x(n),采样率为fs,预加重处理后的信号为x(n)=x(n)-k*x(n-1),其中k为预加重系数,kk介于0.9~1之间;然后对预加重后的信号做分帧和加窗处理。
所述的步骤3求出每帧声音信号的短时能量谱,具体如下:
将经过步骤2处理得到的声音信号做短时傅里叶变换,然后根据频谱求出短时能量谱,设第i帧信号为si(n),对该帧信号作短时傅里叶变换得到Xi(k),通过计算得到短时能量谱为Pi(k)
Pi(k)=Re[Xi(k)]2+IM[xi(K)]2
所述的步骤4基于短时能量谱求出通过Mel三角滤波器组的短时能量,具体的:
将短时能量谱通过一组Mel尺度的三角滤波器组,得到Mel频谱的短时能量Si(m)。定义三角滤波器组的中心频率为f(m),m=1,2,…M,其中M为滤波器的个数,各个中心频率f(m)之间的间隔随着mm值的增大而增宽。
所述的步骤5用立方根对短时能量进行强度-响度转换,具体如下:
为了更好的模拟声音的强度和人耳所感受到响度间的非线性关系,用立方根幅度压缩进行强度-响度转换。
θi(m)=Si(m)1/3
式中,θi(m)表示的是经过强度-响度转换后的第i帧信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710060595.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无直达声条件下的麦克风阵列语音增强装置
- 下一篇:语音处理方法及电子设备