[发明专利]一种基于维度分解的候选区域提取方法在审
申请号: | 201910056596.X | 申请日: | 2019-01-22 |
公开(公告)号: | CN109800809A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 金连文;谢乐乐 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 宋平 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 维度 候选区域 卷积神经网络 损失函数 分解 匹配 线段 目标尺度 参考 宽高比 灵活的 边长 回归 平滑 标签 尺度 敏感 引入 检测 预测 分配 | ||
1.一种基于维度分解的候选区域提取方法,其特征在于,包括以下步骤:
步骤一:引入anchor strings作为模型的回归参考,采用新颖的维度分解思想将anchor boxes分解成独立的一维线段,分别用来预测目标的宽或者高,从而将目标的宽和高两个维度解耦,以应对目标宽高比的多变性;
步骤二:匹配anchor strings和目标边长,进行匹配anchor strings和目标边的时先为每个目标边长寻找最接近的anchor strings,同时,为了避免处于中间的边长在匹配时的模糊,还需要在相邻的anchor strings中间设置了过度区域;
步骤三:网络搭建,搭建的全卷积神经网络,将检测器中用于检测候选区域提取网络的一个全卷积子网络拼接在检测器的特征提取模块之后;
步骤四:标签分配,对anchor strings进行分配训练标签,对处于目标中心的anchorstrings采用步骤二中的匹配方法进行确定标签,对于对于其他的anchor strings采用了先观察后分配的策略进行标签分配;
步骤五:损失函数设计和网络训练,设计一种新颖的尺度敏感的损失函数,再采用SGD算法来训练全卷积神经网络;
步骤六:预测独立的宽高线段并进行维度重组,采用维度重组算法,把每个anchorstring预测的宽或高线段重组成二维的候选框。
2.根据权利要求1所述的一种基于维度分解的候选区域提取方法,其特征在于:所述步骤一中anchor strings被设置为以2为公比的等比数列,且所述等比数列的范围可以确保覆盖绝大部分目标的边长。
3.根据权利要求1所述的一种基于维度分解的候选区域提取方法,其特征在于:所述步骤二中具体匹配公式如公式(1)和(2)所示:
(i=1,2,3,...,N)
(2)
其中,Mj代表的是第j个目标匹配到的anchor strings的序号,ej和ai分别代表第j个目标的边长和等比数列中第i个anchor string,N是等比数列的项数,q是等比数列公比,β用以调整过渡区域的大小。
4.根据权利要求1所述的一种基于维度分解的候选区域提取方法,其特征在于:所述步骤三中候选区域提取网络由一个3x3的卷积层和两个并行的1x1卷积组成,其中,两个并行的1x1卷积层分别负责回归和分类,回归器用于对anchor strings的长度和位置作调整,分类器用于筛选anchor strings,并得到相应的置信度输出。
5.根据权利要求1所述的一种基于维度分解的候选区域提取方法,其特征在于:所述步骤四中具体过程为:标签分配,对anchor strings进行分配训练标签,对处于目标中心的anchor strings,可以按照步骤二中的匹配方法来确定标签,匹配到的设置为正标签,否则为负标签,对于其他的anchor strings采用了先观察后分配的策略,先将anchor strings的预测线段重新组合成二维候选框,如果候选框和真实目标框间的交叠度大于阈值,则赋予相应的anchor strings正的标签,否则为负标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910056596.X/1.html,转载请声明来源钻瓜专利网。