[发明专利]一种基于卷积神经网络的雷声信号识别系统及方法有效
申请号: | 202110266522.6 | 申请日: | 2021-03-11 |
公开(公告)号: | CN113011302B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 章涵;谷山强;李健;严碧武;吴敏;苏杰;雷梦飞;陈扬;许远根;王宇;李涛 | 申请(专利权)人: | 国网电力科学研究院武汉南瑞有限责任公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 武汉开元知识产权代理有限公司 42104 | 代理人: | 李满;潘杰 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 雷声 信号 识别 系统 方法 | ||
1.一种基于卷积神经网络的雷声信号识别系统,其特征在于:包括人工标注模块(1)、训练集数据预处理模块(2)、特征提取模块(3)、模型学习模块(4)、待识别声音数据预处理模块(5)和分类识别模块(6);
所述人工标注模块(1)针对雷声训练集数据进行雷声类型人工标注,并根据雷声类型人工标注后的雷声训练集数据建立雷声分类标签定位文件;
所述训练集数据预处理模块(2)针对所述人工标注模块(1)输出的雷声类型人工标注后的雷声训练集数据进行降采样处理,生成降采样后的雷声训练集数据;
所述特征提取模块(3)用于从所述降采样后的雷声训练集数据中提取梅尔频率倒谱系数;
所述模型学习模块(4)基于卷积神经网络对所述特征提取模块(3)输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件进行训练,获得雷声分类识别模型;
所述待识别声音数据预处理模块(5)针对待识别声音数据进行分帧、降采样和带通滤波预处理得到预处理后的待识别声音数据;
所述特征提取模块(3)还用于从所述待识别声音数据预处理模块(5)输出的预处理后的待识别声音数据中提取梅尔频率倒谱系数;
所述分类识别模块(6)结合所述模型学习模块(4)输出的雷声分类识别模型获得待识别声音数据对应雷声信号和非雷声信号两个类别的概率,当待识别声音数据对应雷声信号的概率大于设定阈值时,则认为待识别信号为雷声信号;
所述特征提取模块(3)提取梅尔频率倒谱系数的具体方法为:
S41,将所述训练集数据预处理模块(2)降采样处理后输出的雷声训练集数据进行高通滤波,用于实现雷声训练集数据的预加重处理;所述高通滤波采用的滤波器函数为H(z)=1-μz-1,式中,H(z)为高通滤波器传递函数,μ为高通滤波器传递系数,z为高通滤波器传递因子;
S42,将步骤S41输出的雷声训练集数据进行分帧处理,帧长为NFFT,两相邻帧数据之间的重叠长度为0.5NFFT;
S43,将每一帧数据乘以汉明窗,设分帧后的声音信号为x(n),n=0,1,…,NFFT-1,式中n表示分帧后声音信号的每帧所在采样点位,则乘上汉明窗后x'(n)=x(n)×w(n),w(n)形式如下:
设雷声训练集数据被分成了M帧数据段,由声音数据加汉明窗后的第m帧数据表示为xm=[xm(0),xm(1),...,xm(NFFT-1)]T,式中,xm(NFFT-1)表示第m帧数据中采样点位位于NFFT-1处的声音信号,T代表转置;
S44,对步骤S43输出的各帧数据段进行快速傅里叶变换得到各帧数据段的频谱Ym(k):
式中,k代表傅里叶变换后的频率值,e表示自然对数,m和M与步骤S43中的含义相同;
S45,将步骤S44输出的频谱通过一个Q阶Mel尺度的三角形滤波器组Ψq,q=1,2,...,Q,计算公式如下:
式中,q表示三角滤波器组的阶数,ym(q)表示经过第q阶Mel尺度的三角形滤波器组变换后的声音数据频谱,Ψq(k)表示频率为k时的三角滤波变换函数;
S46,将步骤S45输出的频谱经离散余弦变换得到各帧数据段的梅尔频率倒谱系数,计算公式如下:
式中,cm(p)表示各帧数据段的梅尔频率倒谱系数,l表示三角滤波器组的阶数,ym(l+1)表示经过l+1阶Mel尺度的三角形滤波器组变换后的声音数据频谱,p表示梅尔频率倒谱系数阶数,P表示梅尔频率倒谱系数的总阶数;
针对各帧数据段可以获得一个尺寸大小为P×M的梅尔频率倒谱矩阵F,基于该矩阵将生成3通道张量作为最终的梅尔频率倒谱系数,所述3通道张量包括梅尔频率倒谱矩阵Δ0=F[:,1:M-2]、F的一阶差分Δ1=F[:,2:M-1]-F[:,1:M-2]和F的二阶差分Δ2=F[:,3:M]-F[:,2:M-1],式中F[:,1:M-2]表示行列式F中列数为1:M-2的所有数值,F[:,2:M-1]表示行列式F中列数为2:M-2的所有数值,F[:,3:M]表示行列式F中列数为3:M的所有数值,F[:,2:M-1]表示行列式F中列数为2:M-1的所有数值,最终生成的梅尔频率倒谱系数矩阵的大小为P×M×3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网电力科学研究院武汉南瑞有限责任公司,未经国网电力科学研究院武汉南瑞有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110266522.6/1.html,转载请声明来源钻瓜专利网。