[发明专利]一种基于多层矩阵随机神经网络的城市噪声识别方法在审
申请号: | 202110995007.1 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113643722A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 曹九稳;张诗晨;王天磊;杨洁;邓木清 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30;G10L25/03;G06N3/04;G06N3/08 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 矩阵 随机 神经网络 城市 噪声 识别 方法 | ||
本发明公开了一种基于多层矩阵随机神经网络的城市噪声识别方法。本发明包括如下步骤:1、对采集到的城市噪声进行预处理,包括去噪、预加重、分帧、加窗等,其中帧长为L,帧移为2、将经过预处理的噪声信号转换成时频图;3、构建矩阵随机自编码器,以城市噪声二维时频图作为矩阵随机自编码器的输入,通过输出重建输入的方式进行训练,获得最优的输出权重作为编码器;同时将上一个相邻矩阵随机自编码器的编码输出作为下一个矩阵随机自编码器的输入,堆叠K个矩阵随机自编码器;4、构建矩阵均方误差损失函数,进行城市噪声分类识别。本发明加快了矩阵随机自编码器的训练速度。免去矢量化步骤、保留时频图信息同时实现有效的城市噪声识别。
技术领域
本发明属于声音信号识别领域,涉及一种基于多层矩阵随机神经网络的城市噪声识别方法。
背景技术
伴随着城市化建设进程的日益推进,城市噪声问题愈发严重,给人类的日常生活和身体健康都带来了不可忽视的影响,因此,采用机器学习的方法,建立实时全天候的城市噪声监测系统进行管控是至关重要的。
目前采用声信号特征提取方法,并结合传统的分类器搭建的实时监控系统,其问题在于,传统的声特征提取方法往往是针对语音信号而设计的,并不完全适用于城市噪声信号;针对城市噪声的特征提取方法无法覆盖到各种声源的特性;此外,由于声信号的非平稳性,这些特征提取方法均是基于一段短时范围内的声信号,其包含的信息有限。
相比较于在一维短时声信号上进行特征提取,采用以时间为横轴,频域特征为纵轴构成的二维时频图,是现在主流的声信号识别所采取的方法,其所包含的信息量是远大于一维短时声信号的。在此基础上,采用卷积神经网络进行学习,或者采用深度迁移特征进行特征提取,结合传统分类器进行识别,是目前流行的两种方式。然而卷积神经网络训练时间长,而深度迁移特征对时频图的表示能力弱,因此目前缺乏有效快速的基于时频图的城市噪声识别方法。
发明内容
为了克服上述城市噪声识别中存在的问题,本发明提出了一种基于多层矩阵随机神经网络的城市噪声识别方法。
本发明的技术方案主要包括如下步骤:
步骤1、对采集到的城市噪声进行预处理,包括去噪、预加重、分帧、加窗等,其中帧长为L,帧移为
步骤2、将经过预处理的噪声信号转换成时频图。
2-1.对经过预处理后的每一帧噪声信号,进行离散傅里叶变换(DFT),将时域信号转换为频域信号。
2-2.对经过DFT后的各帧信号,对各频率点的幅值进行平方,获得该频率点下的能量;
2-3.组合连续的LN帧信号,以频率为纵坐标,横坐标为连续的LN帧信号,构成二维时频图,其中像素点(m,n)的大小表示第m帧,第n个频率点的能量。
步骤3、构建矩阵随机自编码器,以城市噪声二维时频图作为矩阵随机自编码器的输入,通过输出重建输入的方式进行训练,获得最优的输出权重作为编码器。同时将上一个相邻矩阵随机自编码器的编码输出作为下一个矩阵随机自编码器的输入,堆叠K个矩阵随机自编码器。
3-1.通过步骤2处理之后,得到具有N个样本的训练数据集X=[x1,x2,…,xi,…,xN],其中表示由第i张尺寸为d1×d2的时频图,i=1,2,…,N。并记Y(0)=X,即
3-2.将作为输入,随机生成输入权重矩阵以及隐藏层偏置矩计算隐藏层输出为:
其中g(·)激活函数。
3-3.构建矩阵随机自编码器的损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110995007.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种膜状高分子吸水树脂的制备方法
- 下一篇:一种用于手腕康复的六自由度平台