[发明专利]一种基于快速分组残差模块的单特征无锚框目标检测方法在审
申请号: | 202211693108.4 | 申请日: | 2022-12-28 |
公开(公告)号: | CN116091823A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 陶家俊;刘伟;胡为;李小智 | 申请(专利权)人: | 湖南中医药大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/082;G06N3/0464 |
代理公司: | 长沙楚为知识产权代理事务所(普通合伙) 43217 | 代理人: | 李大为 |
地址: | 410208 湖南省长*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 快速 分组 模块 特征 无锚框 目标 检测 方法 | ||
1.一种基于快速分组残差模块的单特征无锚框目标检测方法,其特征在于,包括以下步骤:
S10、对训练样本图像进行图像增强;
S20、构建基于快速分组残差模块的单特征无锚框目标检测网络,包括经过裁剪的RepVGG网络、含有快速分组残差模块的U型特征融合网络及检测头,所述检测头包括分类分支网络、位置分支网络和关键度分支网络;
S30、将所述步骤S10增强后的训练样本输入所述步骤S20的目标检测网络中,预测得到目标类别概率向量、目标位置距离向量和目标关键度的概率向量;
S40、采用正负样本优化策略标记正负样本,根据所述步骤S30中预测得到的向量与真实的向量分别计算分类分支误差、位置分支误差和关键度分支误差,并基于所述分类分支误差、位置分支误差和关键度分支误差更新所述目标检测网络的参数,直至迭代次数达到预设次数;
S50、将迭代次数达到预设次数时所得到的模型作为训练好的所述目标检测网络模型的参数,将待检测图像输入到所述目标检测网络中,得到图像的目标类别概率向量、目标位置距离向量和目标关键度的概率向量,利用关键度分支对预测的类别得分进行调整,并得到最后的目标分类置信度和目标位置。
2.根据权利要求1所述的一种基于快速分组残差模块的单特征无锚框目标检测方法,其特征在于,所述步骤S10中,图像增强包括随机调整亮度、色度和对比度;对图像进行裁剪;以50%概率对图像进行随机左右翻转;以50%概率对图像进行随机缩放,其中缩小倍数不低于原始图像的0.5倍,放大倍数不高于原始图像的3倍;以30%的概率对图像进行随机马赛克拼接;最后得到增强后的图像数据I∈RH×W×3,其中H和W分别是原始图像的长和宽,3为图像通道数。
3.根据权利要求1所述的一种基于快速分组残差模块的单特征无锚框目标检测方法,其特征在于,所述步骤S20的具体步骤如下:
S201、使用修改后的RepVGG-A0作为骨干网络,仅保留RepVGG-A0中C3和C4两层特征层,特征层步长分别为8和16,特征图通道数分别为96和192;
S202、调整输入U型特征融合网络的通道数,设输出特征层通道数为N,若C3或C4的通道数不等于则使用1×1卷积将其通道数调整为分别记为D3和D4,否则直接记为D3和D4;使用分组为4且步长为2的3×3卷积、分组为4且步长为2的1×1卷积和残差连接并行组成的三分支分组卷积块对C4进行两次下采样,分别记为D5和D6,其通道数均为
S203、将特征D6输入快速分组残差模块得到P6;
S204、使用双线性插值对P6上采样,将特征图P6放大到与前一层D5相同的大小,接着将D5与P6串联起来得到通道数为N的特征图,最后将串联后的特征输入所述步骤S203中的快速分组残差模块得到P5;
S205、对D4和D3重复所述步骤S203到S204,分别得到P4和P3,最后仅取P3作为最终的特征层;
S206、对P3分别使用两个输入和输出通道数均为N的三分支分组卷积块,分别记为P3'和P3”;对P3'使用一个输出通道数为C的1×1卷积生成分类分支,C为类别数,得到P3层各像素点各类别概率向量其中i为P3上像素点横坐标,j为P3上像素点纵坐标,c为类别编号,c={1,···,C};对P3”使用一个输出通道数为4的1×1卷积生成定位分支,得到P3层各像素点到边界框的位置距离向量对P3”使用一个输出通道数为1的1×1卷积生成关键度分支,得到P3层各像素点关键度的概率向量
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南中医药大学,未经湖南中医药大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211693108.4/1.html,转载请声明来源钻瓜专利网。