[发明专利]一种基于Yolov3的高清图像目标检测方法在审
申请号: | 202110255601.7 | 申请日: | 2021-03-09 |
公开(公告)号: | CN112907553A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 樊杨;张呈凯;宋河;温凯林;李天红;蔡觉平 | 申请(专利权)人: | 苏州鸿鹄骐骥电子科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G06K9/62;G06N3/04 |
代理公司: | 太原市科瑞达专利代理有限公司 14101 | 代理人: | 李富元 |
地址: | 215008 江苏省苏州市姑*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 yolov3 图像 目标 检测 方法 | ||
1.一种基于Yolov3的高清图像目标检测方法,其特征在于,包括以下步骤:
步骤一、进行准备工作,对Yolov3网络进行特定剪裁,去掉其中针对大目标、中目标检测而引入的两条分支,只保留小目标检测的计算分支,精简网络以提高计算速度;针对剪裁后的Yolov3网络,使用摄像机拍摄含有待检测目标的图片,使用手工标注方式分别制作训练数据集和测试数据集,训练剪裁后的Yolov3网络作为后续的目标检测网络;
步骤二、手工制作标准目标图像,在其标准目标图像中央位置包含有典型小目标,典型小目标为无遮挡,无扭曲的待检测目标,将典型小目标输入上述训练好的Yolov3网络中,得到其主干网络Darknet-53输出的52*52*256尺寸的特征向量,52*52*256代表的含义是将图划分为52*52的网格区域,每一个网格区域对应一个尺寸为1*256的特征列向量,特征向量的中央位置的典型小目标对应的特征向量,大小为1*256,记为标准特征块t_sd,在之后相似度匹配过程中作为匹配标准向量;
步骤三、将一幅包含典型小目标的待检测图像作为输入,将其缩放至416*416大小,记为img,输入Yolov3网络,得到其主干网络Darknet-53输出的52*52*256的特征向量,52*52*256代表的含义是将图划分为52*52的网格区域,每一个网格区域对应一个尺寸为1*256的特征列向量;
步骤四:引入相关回归思想,将上步骤img的各个网格区域的特征向量与标准特征块t_sd进行相似度匹配,根据匹配结果计算原图中各个网格区域是否可能存在目标的信息;
相似度匹配过程使用两个特征向量的余弦距离表示两者的相关程度,其公式如下,A和B分别代表要匹配的两个特征向量,A代表img特征向量,B代表t_sd特征向量,尺寸为1*256:
公式中i为1-256中的一个数字,得到的相似度cosθ的范围为从-1到1,表示从最不相关到最相关,将相似程度cosθ超过阈值的网格区域标注为1,其它网格区域标注为0,表示此区域有可能存在目标(典型小目标),阈值定义为有目标区域的相似度与无目标区域相似度最大值之间的中间值;
步骤五:根据步骤四的匹配结果,对原图中可能存在目标的区域进行裁剪,并送入Yolov3网络进行精细检测;不存在目标的区域直接舍弃,从而避免对整幅图进行遍历搜索,经原图裁剪和精细检测后,最终YOLOv3网络输出各个典型小目标在高清图像中的位置,形式为矩形框坐标(x,y,w,h),分别代表目标框的中心坐标(x,y)、长w、宽h。
2.根据权利要求1所述的基于Yolov3的高清图像目标检测方法,其特征在于:所述的高清图像像素大小为1440*2560以上。
3.根据权利要求1所述的基于Yolov3的高清图像目标检测方法,其特征在于,步骤一所述的大目标、中目标是指将图像缩放到416*416像素分辨率后,目标所占像素大小分别在116*90、16*30以上的,可以被目标检测网络有效识别的较大尺寸目标;而小目标是指相同条件下,目标所占像素大小在10*13以下,不能被网络有效检测出来的目标。
4.根据权利要求1所述的基于Yolov3的高清图像目标检测方法,其特征在于,步骤一所述的剪裁掉Yolov3针对大目标、中目标预测分支的操作,指的是去掉Yolov3结构中特征层尺寸为13*13及26*26的两条计算分支,只保留52*52的计算分支,也就是说针对特定目标大小的应用场景,不需要进行多尺度预测,以此提高计算速度。
5.根据权利要求1所述的基于Yolov3的高清图像目标检测方法,其特征在于,步骤二所述的手工制作标准目标图像,是指制作一张在图像中央位置含有典型的小目标的图像,分辨率为输入的待检测高清图像分辨率,再缩放至416*416像素后使用。
6.根据权利要求1所述的基于Yolov3的高清图像目标检测方法,其特征在于,步骤五所述裁剪是指以可能存在目标的网格区域对角线为中心,抠取大小为416*416的图像块。同时,为了防止某些区域被多个网格重复抠取,使用NMS算法,滤除重叠率超过50%的抠取部分,重叠率使用IoU(Intersection over Union),即交并比来衡量,定义为如下公式:
其中Area1和Area2分别表示重叠的两个抠取图像面积,如果这两张图像计算来的IoU大于0.33,就说明重叠部分超过50%,删除掉其中一个抠取图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州鸿鹄骐骥电子科技有限公司,未经苏州鸿鹄骐骥电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110255601.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种企业非法集资行为风险预警方法及系统
- 下一篇:一种机轮刹车力矩测试装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序