[发明专利]一种基于多层特征对齐的跨域目标检测方法有效
申请号: | 201910594012.4 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110363122B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 王蒙;李威 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06V20/58 | 分类号: | G06V20/58;G06V10/774;G06V10/82;G06V10/25;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 特征 对齐 目标 检测 方法 | ||
本发明公开了一种基于多层特征对齐的跨域目标检测方法。首先,通过深度卷积神经网络在有边框标注的源域数据集上训练检测器。然后,将训练好的检测器作为预训练模型,并通过深度卷积神经网络VGG‑16对源域与没有边框标注的目标域的图片进行特征提取,使源域与目标与共享特征参数。其次,设计领域分类器,将提取到的多层源域与目标域的特征层作为领域分类器的输入,判断特征层是来自于源域还是目标域。再通过对抗生成网络的训练方式,使得源域与目标域的特征分布对齐,进而减少两个领域之间的数据偏差。最后,通过将检测器与判别器进行联合训练,从而得到最终的模型。本发明实现了将源域知识迁移到目标域,提升了无边框标注的目标域数据的检测精度。
技术领域
本发明涉及计算机视觉领域,特别是涉及一种基于多层特征对齐的跨域目标检测方法。
技术背景
近年来,随着深度神经网络的发展,基于数据驱动的计算机视觉,取得了重大进展。目标检测作为计算机视觉的基础任务,更是得到了研究人员广泛的关注,在人们的智能生活中扮演着越来越多的角色。例如,在智能驾驶中,通过3D目标检测可以实现过往车辆以及周边场景的快速的定位,从而汽车可以避开障碍物并顺利行驶;在智慧零售业务中,通过精确的目标检测,可以清点货架上的商品,实现无人销售,节省劳力;在智能小区中,通过车牌检测,可以快速识别过往车辆,从而实现自动放行。总而言之,目标检测,越来越成为我们生活中不可缺少的一部分。
尽管基于数据驱动的目标检测任务取得了重大的进展,但是在实际生产应用中,却面临诸多的困难。基于深度卷积神经网络的目标检测算法,需要大量的边框标注与分类标注,而在实际场景业务中,从数据的收集到标注,需要耗费大量的人力物力。一方面,我们在许多场景中,如天气良好情况下的道路场景,已经收集了大量的数据,并且在相关业务中取得了不错的效果。另一方面,我们在某些特殊领域,如在少见的雾霾天气下的道路场景图片,却难以收集。如何将已有的大量数据应用到新的业务场景中,以节省人力物力,是我们面临的一项难题。
目前,主要的解决方法有两类:弱监督的目标检测方法与基于领域对齐的方法。在弱监督的目标检测任务中,只用到了分类标注,故而实际的定位精度较差,在实际中难以使用。另一种是基于迁移学习的领域对齐方法。在这种方法中,通常采用使源域与目标域的第一或第二统计量距离最小,或者是将源域与目标与投影到一个共同的特征空间中,在度量二者的距离使其尽量小。然而,由于深度卷积神经网络的使用,源域与目标域均投影到高维的数据空间中,这种基于距离度量的方法往往难以有效,有时甚至会起到相反的作用。伴随着深度对抗生成网络的发展,有人将其用于域自适应中的特征对齐。受此启发,我们将对抗生成网络融入到目标检测网络中,将检测网络与对抗网络联合训练,使得在训练过程中,源域特征与目标域特征对齐,从而实现从将在源域上训练好的检测模型泛化到目标域数据中。
目标检测作为计算机视觉中的基本任务,其主要包括两个过程,即定位和识别。自R-CNN提出以来,基于卷积神经网络的检测模型得到了迅速发展。目前主要有两类,即基于候选区域的目标检测方法与无候选区域的目标检测方法。在基于候选区域的检测模型中,其检测过程分为两步。首选使用区域提取网络得到感兴趣的候选区域,主要是通过判断该区域是否存在我们要检测的目标。在得到候选区域后,在通过分类和回归的方法对该区域进行分类并得到其坐标位置。这类检测器的代表,主要是R-CNN,fast R-CNN,faster R-CNN以及Mask R-CNN 等模型,其主要特点是检测精确,但速度较慢。无候选区域的检测方法,主要是通过在图片上划分网络,然后分别进行回归和分类处理处理,将定位与识别作为一个过程来实现,其典型代表就是yolo、SSD等。由于没有候选区域的提取过程,这类方法的速度较快,但精度较低。尽管这些基于全监督的检测方法均取得了不错的效果,但过于依赖大量的数据,不能有效利用已有的大量数据。而数据的收集到标注,均需要大量的人力物力。
发明内容
本发明主要解决的技术问题是提供一种多层域自适应的跨域目标检测方法,通过加入对抗生成网路,使得判别器无法分辨特征层来自于源域还是目标域,从而使得源域与目标域特征分布类似,进而将目标域上的标注信息迁移到源域数据集,以提升检测器在目标域上的性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910594012.4/2.html,转载请声明来源钻瓜专利网。