[发明专利]一种用于物体检测的深度分割引导网络有效
申请号: | 201811205606.3 | 申请日: | 2018-10-15 |
公开(公告)号: | CN109543519B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 庞彦伟;曹家乐 | 申请(专利权)人: | 天津大学 |
主分类号: | G06V20/70 | 分类号: | G06V20/70;G06V10/82;G06V10/80;G06N3/04;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 物体 检测 深度 分割 引导 网络 | ||
本发明涉及一种用于物体检测的深度分割引导网络,包括:确定基础网络:包括多个卷积块,每个卷积块由多个卷积层构成,不同卷积块之间由池化层连接。设计用于提取语义分割上下文信息的深度语义分割引导模块:对于基础网络中每一个卷积块输出的特征图,首先利用卷积层提取语义分割特征,然后利用卷积层提取语义分割的预测逻辑图,最后利用卷积层和sigmoid函数对预测逻辑图进行上采样输出检测引导特征图,语义分割的预测逻辑图在训练过程中由语义分割任务进行监督。利用分割引导模块引导物体检测特征学习。输出物体检测结果。
技术领域
本发明涉及视频监控、无人驾驶等计算机视觉领域中物体检测方法,特别是涉及基于深度学习进行物体检测的方法。
背景技术
物体检测在许多计算机视觉领域具有广泛的应用,如无人驾驶、辅助驾驶、身份认证、人机交互、智能交通、智能搜索等。图1给出了物体检测在辅助驾驶系统和智能搜索系统中的应用示例。图1(a)中,汽车行驶在夜间的公路上。汽车的辅助驾驶系统及时地检测到汽车前方存在的行人,并提醒司机注意减速。图1(b)中,相关系统需要从大量监控视频、图像数据中找到给定图像中的目标人物。因此,智能搜索系统需要首先从大量视频、图像数据中检测到存在的人,然后判断这些人是否与目标人物匹配。
由于丰富的特征表达能力和大数据的出现,深度卷积神经网络在图像分类和物体检测等领域取得了巨大的成功。一般而言,基于深度卷积神经网络的物体检测方法可以分为两类:两阶段的物体检测方法和单阶段的物体检测方法。两阶段的物体检测方法包括候选窗口提取和候选窗口分类等两步。候选窗口提取主要用于从图像中提取可能为物体的检测窗口,候选窗口分类主要用于判断这些候选窗口所属物体的具体类别。2015年Ren等人提出的Faster RCNN是十分具有代表性的两阶段物体检测方法[1]。为了减少网络的总体计算消耗量,Faster RCNN提出让候选窗口提取和候选窗口分类两部分共享同一个基础网络。
尽管基于深度卷积神经的物体检测方法取得了一定的成功,但是当前物体检测方法仍然存在一些问题:(1)复杂场景下的虚检问题。例如,道路两旁的电线杆、广告牌等物体容易被识别为汽车或行人等。(2)物体遮挡时的漏检问题。例如,被汽车遮挡的行人很容易被漏掉。这些问题背后的主要原因在于,物体检测方法没有能够充分利用图像的上下文信息和语义分割信息。
为了增加上下文信息和语义分割信息用于物体检测,近年来研究人员也进行了一些尝试。例如,Lin等人[2]提出将低分辨率、高语义级别的特征图进行上采样,然后同高分辨率、低语义级别的特征图进行融合生成高分辨率、高语义级别的特征图。RON[3]和DSSD[4]也采用类似的自上而下跨连接思想。为了增加语义分割信息,研究人员尝试将语义分割任务和物体检测任务统一在同一个框架下。例如,Brazil等人[5]提出检测和分割相融合的网络,该网络同时输出物体检测的结果和语义分割的结果。类似地,Dvomik等人[6]也提出联合物体检测和语义分割。Mao等人[7]和Zhao等人[8]提出将语义分割的特征图和物体检测的特征图进行融合后进行物体检测,进而提升物体检测的性能。尽管这些方法取得了一定的成功,但是语义分割信息仍然没有被物体检测充分利用。
参考文献:
[1]S.Ren,K.He,R.Girshick,and J.Sun,Faster R-CNN:Towards Real-TimeObject Detection with Region Proposal Networks,IEEE Trans.Pattern Analysisand Machine Intelligence, vol.39,no.6,pp.1137-1149,2017.
[2]T.Lin,P.Dollar,R.Girshick,K.He,B.Hariharan,and S.Belongie,FeaturePyramid Networks for Object Detection,Proc.IEEE Computer Vision andPatternRecognition,2017.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811205606.3/2.html,转载请声明来源钻瓜专利网。