[发明专利]一种基于改进残差神经网络的人员落水检测识别方法在审
申请号: | 202011035521.2 | 申请日: | 2020-09-27 |
公开(公告)号: | CN112232144A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 姜喆;王天星;段一琛;杨舸 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 金凤 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 神经网络 人员 落水 检测 识别 方法 | ||
1.一种基于改进残差神经网络的人员落水检测识别方法,其特征在于,包括以下步骤:
步骤1:将水听器布放于水中,采集周围环境音频信号;将采集到的音频信号分为5种情况,分别为人员落水、人员落水且挣扎、小型杂物落水、大型杂物落水和无落水物体;将人员落水和人员落水且挣扎两种情况的音频信号作为正类样本数据,将小型杂物落水、大型杂物落水和无落水物体三种情况的音频信号作为负类样本数据;
步骤2:对正类样本数据和负类样本数据的每个音频信号进行滑窗切片处理,然后进行短时傅里叶变换得到每个音频信号的时频特征图;再将每个时频特征图的尺寸调整为l1*l2,并进行像素值归一化处理;对经过上述处理后的所有时频特征图打上标签:正类样本数据对应的时频特征图的标签为0,负类样本数据对应的时频特征图的标签为1;打过标签的正类样本数据对应的时频特征图构成正类样本数据集,打过标签的负类样本数据对应的时频特征图构成负类样本数据集;
步骤3:在正类样本数据集里随机选取a%的时频特征图作为正类训练集,正类样本数据集的剩余部分作为正类测试集,50a100;在负类样本数据集里随机选取b%的时频特征图作为负类训练集,负类样本数据集的剩余部分作为负类测试集,50b100;
再将正类训练集和负类训练集合并,并随机打乱排列顺序,构成总体训练集;将正类测试集和负类测试集合并构成总体测试集;
步骤4:构建改进的残差神经网络模型:
步骤4-1:在ResNet34模块的基础上构建具有5个layer的残差神经网络模型,其中第1个layer由2个卷积层和2个批量归一化层构成,第2个layer到第5个layer分别由3、4、6、3个残差块构成;在改进的残差神经网络模型中的每个残差块中加入SE模块,SE模块由p个全局平均池化层和q个全连接层构成;
步骤4-2:定义损失函数:
loss=-αt(1-pt)γlog(pt)
其中,pt是改进的残差神经网络模型预测样本属于正类或负类的概率;αt是权重系数,αt∈(0,1);γ是调制系数,γ∈(0,1);
步骤5:采用总体训练集对步骤4构建的改进的残差神经网络模型进行训练,使用步骤4-2定义的损失函数作为目标函数,采用Adam算法进行优化,共训练B轮;将每轮训练得到的改进的残差神经网络模型使用总体测试集测试识别准确率,保存B轮训练中准确率最高的一个神经网络模型作为最优模型;
利用最优模型画出混淆矩阵图,计算使用最优模型对总体测试集进行测试的查准率和查全率;
步骤6:使用步骤5训练出的最优模型作为最终的检测识别模型;将水听器实时采集到的音频信号进行滑窗切片处理,然后进行短时傅里叶变换得到音频信号的时频特征图;再将时频特征图输入到最终的检测识别模型中,最终的检测识别模型输出为对人员是否落水准确的识别结果。
2.根据权利要求1所述的一种基于改进残差神经网络的人员落水检测识别方法,其特征在于,所述l1=224,l2=224。
3.根据权利要求1所述的一种基于改进残差神经网络的人员落水检测识别方法,其特征在于,所述a=70,b=70。
4.根据权利要求1所述的一种基于改进残差神经网络的人员落水检测识别方法,其特征在于,所述p=1,q=2。
5.根据权利要求1所述的一种基于改进残差神经网络的人员落水检测识别方法,其特征在于,所述B=100。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011035521.2/1.html,转载请声明来源钻瓜专利网。