[发明专利]一种基于聚类算法和神经网络的多尺度目标检测方法在审
| 申请号: | 202010198410.7 | 申请日: | 2020-03-19 |
| 公开(公告)号: | CN111652836A | 公开(公告)日: | 2020-09-11 |
| 发明(设计)人: | 苏寒松;田曦初;刘高华 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06K9/62;G06T7/62;G06N3/04 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 算法 神经网络 尺度 目标 检测 方法 | ||
本发明公开了一种基于聚类算法和神经网络的多尺度目标检测方法,对于输入图片进行统一尺寸、灰度化处理,将机器学习k‑means算法和深度学习神经网络结合起来,融合了两者的优点,实现目标检测网络的检测。与现有技术相比,本发明选择轻量级网络作为网络框架,避免了神经网络结构复杂臃肿、参数庞大冗余的问题;并通过一些数据预处理手段进一步减小整个网络计算开销;同时为改进多尺度目标检测的方式,结合了机器学习中k‑means聚类算法和神经网络,在控制计算开销的同时切实提高无区域提议算法的识别准确率。
技术领域
本发明涉及计算机视觉领域和人工智能的深度学习技术领域,特别涉及一种基于聚类算法和神经网络的目标检测方法。
背景技术
随着计算机技术的发展,计算机视觉领域取得了巨大进展,目标检测作为计算机视觉领域的基础问题一直备受关注,并且在无人驾驶、视频监控、视频分析等领域有着广泛的应用应用前景。
传统的目标检测方法有很多,常用的有帧间差分法、背景减除法和光流法。(1)帧间差分法是将固定间隔的视频帧进行比较,该方法适合动态变化的环境却不适用于静态物体,且会产生大面积的空洞,提取目标的完整性较差;(2)光流法因其计算复杂、计算量庞大,很难满足运动检测的实时性;(3)背景差分法通过当前视频帧和背景帧进行差分运算实现对运动目标检测,但受光照和背景的变化影响较大。
近年深度学习算法的迅猛发展使其在计算机视觉领域的研究中已超过传统算法,全面革新了目标检测的模式,且端到端的方式便利了不同知识背景的人进行操作。故目前多采用深度学习神经网络的方法进行目标检测。大致可分为两个主流:一是基于区域提议的方法,其首先生成提议区域,然后放入分类器分类并修正位置,如RCNN、FastRCNN以及FasterRCNN;二是无区域提议的方法,其不生成提议区域,直接对全图进行目标位置检测和分类,如YOLO、SSD。基于区域提议的目标检测算法由于在提取感兴趣区域的过程中耗时严重,并不适合于实时检测;无区域提议的算法的检测实时性好,但是也因训练过程没有目的性而浪费了大量计算开销,且导致检测精度不高等问题。
考虑到实际应用中对实时性要求较高,本发明选择在无区域提议算法的基础上进行改进。
发明内容
本发明旨在提出一种基于聚类算法和神经网络的多尺度目标检测方法,选择轻量级网络,对于输入图片进行统一尺寸、灰度化处理,将机器学习k-means算法和深度学习神经网络结合起来,融合了两者的优点,实现目标检测网络的检测。
本发明的一种基于聚类算法和神经网络的多尺度目标检测方法,包括以下步骤:
步骤1、训练数据集图片预处理,具体包括以下处理:
步骤101、对于训练数据集图片进行标注,即用矩形框完整包围待检测目标形成数据框,依次标注图中每个数据框对应的目标类别名称;
步骤102、将训练数据集图片放缩到统一的尺寸,得到同尺寸图片;
步骤103、将同尺寸图片灰度化处理;
步骤104、选择12个目标检测参考面积,使用机器学习中的k-means聚类算法,将步骤102中标注的矩形框进行聚类,即:将所有矩形框按面积大小相近程度分成12组,每组分别计算平均面积值以及平均宽、高;计算过程如下:
已知待测集合(x1,x2,...,xn),利用k-means聚类将这n个值划分到k个集合中(k≤n),使得组内平方和最小,即找到使得下式满足的聚类:
其中,SSE是误差平方和(sum ofthe squared errors),μi是集合Si中所有点的均值,x是集合Si中的样本点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010198410.7/2.html,转载请声明来源钻瓜专利网。





