[发明专利]基于深度可分离卷积及融合PAN的多级特征金字塔目标检测方法在审
申请号: | 202110325504.0 | 申请日: | 2021-03-26 |
公开(公告)号: | CN113111736A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 包晓安;马铉钧;包梓群;邵一鸣;马云龙;许铭洋;张娜 | 申请(专利权)人: | 浙江理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310018 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 可分离 卷积 融合 pan 多级 特征 金字塔 目标 检测 方法 | ||
1.一种基于深度可分离卷积及融合PAN的多级特征金字塔目标检测方法,其特征在于,包括以下步骤:
1)数据采集:获取待检测目标的视频数据并进行切片,将连续的视频数据转换为连续的图像;
2)对图像进行预处理;
3)对预处理后的图像进行目标检测,利用深度可分离卷积及融合PAN的多级特征金字塔网络获得图像的多尺度融合特征图;
所述的深度可分离卷积及融合PAN的多级特征金字塔网络包括骨干网络、带有PAN结构的多级FPN网络;所述的骨干网络对输入图像下采样得到不同大小的特征图,每次下采样都采用深度可分离卷积,再通过上采样将特征图融合,获得包含不同深度特征的融合特征图,将融合特征图送入带有PAN结构的多级FPN网络;
所述的带有PAN结构的多级FPN网络由若干个结构相同的特征金字塔串联而成,每个特征金字塔的下采样层都由深度可分离卷积组成,上采样层由深度可分离卷积和上采样卷积构成;第一个特征金字塔的输入为骨干网络输出的融合特征图,将融合特征图与前一级特征金字塔最后一个上采样层的输出按通道方向连接,作为后一级特征金字塔的输入;不同的特征金字塔用来提取不同深度的特征,将每一级特征金字塔的输出按照通道方向连接,获得多尺度融合特征图;
4)根据多尺度融合特征图的感受野大小预定义多长宽比与多尺度的检测框,利用检测框完成对目标的定位与分类,实现对多尺度目标进行高精度的检测。
2.根据权利要求1所述的基于深度可分离卷积及融合PAN的多级特征金字塔目标检测方法,其特征在于,步骤2)所述的预处理方法为滤波方法,以图片上的像素点为中心取正方形区域,将区域中每个像素点的灰度值进行排序,取排序的中间值作为中心像素灰度的新值,以滑窗的方式遍历图像。
3.根据权利要求1所述的基于深度可分离卷积及融合PAN的多级特征金字塔目标检测方法,其特征在于,所述的深度可分离卷积包括输入层、逐通道卷积层、逐点卷积层、输出层;所述输入层的输入为三通道图像,首先对输入的三通道图像进行逐通道卷积操作,利用三个卷积核分别对三通道进行卷积,生成三张特征图;再利用三维卷积核对三张特征图进行逐点卷积,将三张特征图合成一张特征图输出。
4.根据权利要求1所述的基于深度可分离卷积及融合PAN的多级特征金字塔目标检测方法,其特征在于,所述的骨干网络由四个卷积层和两个上采样层构成,将预处理后的图像输入到骨干网络之后,依次经过四个卷积层处理,第四个卷积层的输出连接第一个上采样层,第一个上采样层的输出与第三个卷积层的输出按照通道方向连接后,再作为第二个上采样层的输入;第二个上采样层的输出与第三个卷积层的输出按照通道方向连接后作为骨干网络的输出。
5.根据权利要求1所述的基于深度可分离卷积及融合PAN的多级特征金字塔目标检测方法,其特征在于,所述的带有PAN结构的多级FPN网络由若干个结构相同的特征金字塔串联而成,每一个特征金字塔包括输入层、四个下采样层、两个上采样层;
特征金字塔的输入层获取图像后,依次经过第一个下采样层和第二个下采样层处理,将第二个下采样层的输出作为第一个上采样层的输入,将第一个上采样层的输出与第一个下采样层的输出按照元素相加,再作为第二个上采样层的输入;第二个上采样层的输出与特征金字塔的输入层获取的图像按照元素相加,相加后的结果一方面作为第一张特征图输出,另一方面作为第三个下采样层的输入;将第三个下采样层的输出与第二个上采样层的输入按照元素相加,相加后的结果一方面作为第二张特征图输出,另一方面作为第四个下采样层的输入;将第四个下采样层的输出与第二个下采样层的输出按照元素相加,相加后的结果作为第三张特征图输出;
将前一个特征金字塔中的最后一个上采样层的输出与骨干网络的输出按通道方向连接,作为后一级特征金字塔的输入层的输入图像;每一个特征金字塔均输出三张不同尺寸的特征图,将对应尺寸大小的特征图按照通道方向相连接,得到最终的多尺度融合特征图,如下:
Xi=Concat(Xi1,Xi2,Xi3,Xi4,……,Xin),n=1,2,3……,i=1,2,3
其中,Xi1表示第一特征金字塔输出的第i个特征图,Xi为融合后的第i个特征图,n表示多级特征金字塔的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江理工大学,未经浙江理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110325504.0/1.html,转载请声明来源钻瓜专利网。