[发明专利]一种基于聚类算法和神经网络的多尺度目标检测方法在审
| 申请号: | 202010198410.7 | 申请日: | 2020-03-19 |
| 公开(公告)号: | CN111652836A | 公开(公告)日: | 2020-09-11 |
| 发明(设计)人: | 苏寒松;田曦初;刘高华 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06K9/62;G06T7/62;G06N3/04 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 算法 神经网络 尺度 目标 检测 方法 | ||
1.一种基于聚类算法和神经网络的多尺度目标检测方法,其特征在于,该方法包括以下步骤:
步骤1、训练数据集图片预处理,具体包括以下处理:
步骤101、对于训练数据集图片进行标注,即用矩形框完整包围待检测目标形成数据框,依次标注图中每个数据框对应的目标类别名称;
步骤102、将训练数据集图片放缩到统一的尺寸,得到同尺寸图片;
步骤103、将同尺寸图片灰度化处理;
步骤104、选择12个目标检测参考面积,使用机器学习中的k-means聚类算法,将步骤102中标注的矩形框进行聚类,即:将所有矩形框按面积大小相近程度分成12组,每组分别计算平均面积值以及平均宽、高;计算过程如下:
已知待测集合(x1,x2,...,xn),利用k-means聚类将这n个值划分到k个集合中(k≤n),使得组内平方和最小,即找到使得下式满足的聚类:
其中,SSE表示误差平方和(sum of the squared errors),μi是集合Si中所有点的均值,x是集合Si中的样本点;
选择12个目标检测参考面积,使用机器学习中的k-means聚类算法,将步骤102中标注的矩形框进行聚类,即将所有矩形框按面积大小相近程度分成12组,每组分别计算平均面积值以及平均宽、高,然后将计算出的12个平均面积当做后续目标检测网络的基准面积,重点检测与这些面积大小相似、宽高比例相仿的区域中是否有目标以及目标属于何种分类,并根据结果微调面积,使网络能准确标定目标框并检测出目标所属类别;
步骤2、设计并训练目标检测网络,具体包括以下处理:
步骤201:将上述12个基准面积从小到大排列,得到序列[a1,a2,a3,b1,b2,b3,c1,c2,c3,d1,d2,d3],然后将该序列等分为4份分给不同尺度特征图做检测参照:[a1,a2,a3]分配给最大的特征图,[b1,b2,b3]分配给第二大的特征图,[c1,c2,c3]分配给第三大特征图,[d1,d2,d3]分配给最小的特征图;
步骤202、训练目标检测网络至收敛,即以MobileNet为基础网络,后面加4层不同尺度的特征图用于检测不同尺度的目标;将在不同特征图其对应的参考框位置表示为a=(acx,acy,aw,ah),acx和acy表示参考框中心坐标,aw和ah表示参考框宽高;将目标框真实位置表示为b=(bcx,bcy,bw,bh);
预测值p计算公式如下:
训练过程就是不断优化p的值而使检测效果越来越好的过程;
从最后一层特征图开始向上进行3次上采样和通道加和的操作,使得每层特征图都有其他特征图的信息,以增强检测效果;
步骤203、待收敛后固定目标检测网络所有层参数不再变化,得到最终目标检测网络;
步骤3、待测试图片预处理,与训练图片预处理部分相似,具体包括以下处理:
步骤301、将待测试图片放缩到统一的尺寸;
步骤302、图像灰度化处理;
步骤4、将处理后的待测图片输入目标检测网络,检测完毕后输出标注了检测框和类别的结果图片,完成检测任务;
后续再进行其他的检测任务,只需重复进行步骤3、步骤4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010198410.7/1.html,转载请声明来源钻瓜专利网。





