[发明专利]一种改进DSOD网络的方法有效
申请号: | 201910029814.0 | 申请日: | 2019-01-12 |
公开(公告)号: | CN109784476B | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 程树英;吴建耀;郑茜颖;林培杰;陈志聪;吴丽君 | 申请(专利权)人: | 福州大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06V10/764;G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 362251 福建省泉州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 改进 dsod 网络 方法 | ||
1.一种改进DSOD网络的方法,其特征在于:包括以下步骤:
步骤S1:获取数据集中的图像作为输入图像,并将输入图像输入到输入层;对输入图像进行裁剪、镜像和去均值化预处理,得到预处理后的图像,同时利用归一化方法将预处理后的图像中的绝对坐标转换成相对坐标;
步骤S2:在DSOD网络中的特征提取子网络的第二个转接层后加入RFB_a网络模块;将步骤S1中预处理后的图像输入到DSOD网络中的特征提取子网络进行特征提取;将DSOD网络中的特征提取子网络中的第二个转接层的特征图输入到RFB_a网络模块中,经过RFB_a网络模块中不同采样步长的Atrous膨胀卷积,提取具有不同感受野的特征;所述提取的不同感受野特征输入到3×3卷积层中,形成DSOD网络的第一个尺度预测层;
步骤S3:将有预设采样步长的Atrous卷积层加入到所述DSOD网络中的特征提取子网络后,并将步骤S2中所述特征提取子网络的特征图输入到具有预设采样步长的Atrous卷积层中,用以增大特征图的感受野;同时,将Atrous卷积层产生的特征输入到DSOD网络中的多尺度预测层中,形成5个尺度预测层;
步骤S4:将步骤S2中所述的DSOD网络的第一个尺度预测层和步骤S3所述的5个尺度预测层的特征输入到加入IOG惩罚项的多任务损失函数L中;
步骤S5:通过预热策略设置学习率,利用梯度下降算法优化所述DSOD网络中的所有网络层的权值;设置样本大小,用以降低训练DSOD网络的硬件设备要求;
步骤S4所述加入IOG惩罚项的多任务损失函数L具体为:
步骤S41:计算DSOD网络输出的预测框p与预设样本所有真实框G面积交并比最大的预测框giou_max,公式如下:
其中,g表示真实框,G表示所有真实框的集合,p表示预测框,P表示所有预测框集合,boxg表示真实框的面积,boxp表示预测框的面积;
步骤S42:将步骤S41中交并比最大面积的真实框去除,再计算预测框与剩余真实框的最大的IOG惩罚项,将最大的IOG惩罚项作为Liog损失函数,计算公式如下:
步骤S43:将Liog损失函数和定位损失函数Lloc以及分类损失函数Lconf函数进行加权融合,形成最终的多任务损失函数L,公式如下:
其中,N表示检测的正样本的数量,α表示定位损失的Lloc的权重;定位损失函数Lloc采用的是xmoothL1损失;分类损失函数Lconf采用信息交叉熵进行计算;定位损失函数Lloc计算如下:
其中,指示函数,表示第i个默认框匹配第j个类别为k的真实框,l表示预测框的位置坐标,pos表示正样本的默认框,N表示的正样本的数量;smoothL1计算如下:
分类损失Lconf计算如下:
其中,c表示每一个类别的置信度,Neg表示负样本,p表示类别,0表示类别是背景, 表示第i个预测框为类别p的概率,计算如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910029814.0/1.html,转载请声明来源钻瓜专利网。