[发明专利]一种基于点击监督训练的目标类别检测方法在审

专利信息
申请号: 201710431113.0 申请日: 2017-06-08
公开(公告)号: CN107273891A 公开(公告)日: 2017-10-20
发明(设计)人: 夏春秋 申请(专利权)人: 深圳市唯特视科技有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 518057 广东省深圳市高新技术产业园*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 点击 监督 训练 目标 类别 检测 方法
【说明书】:

技术领域

发明涉及图像处理中的目标检测领域,尤其是涉及了一种基于点击监督训练的目标类别检测方法。

背景技术

自然界的一切图像都是连续变化的模拟图像,在日常生活中,这些图像中的运动目标往往是我们比较关心的,如:行人、行驶的交通工具以及其他的物体。目标检测和识别是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域。因此,目标检测也就成为了近年来理论和应用的研究热点,它是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分。它的目的就是如何快速、准确地检测出监控视频中的目标,即从序列图像中将目标提取出来。迄今,目标类别检测器的训练已经存在很多方法,如何在尽量减少人的标注工作的同时训练出高质量的检测器具有重要的现实意义。

本发明提出了一种基于点击监督训练的目标类别检测方法,其主要内容包括:点击监督、弱监督目标定位、众包架构、点击监督与弱监督目标定位的合并,其过程为,要求标注者去点击紧密包围目标中实体的虚构边界框的中心,然后将这些所点击点合并到现有的用于弱监督目标定位的多实体学习技术中,这样就可以在所有训练图像上共同进行目标边界框的定位。本发明训练出了高质量的目标类别检测器,其表现比用弱监督训练技术所产生的检测器要好得多,并且还可以进行适度的额外标注。这些检测器的执行结果实际上在一定范围内接近手动绘制边界框所训练的结果,且由于中心点击任务执行的非常快,此发明将总标注时间缩短了9倍到18倍。

发明内容

针对本发明训练出了高质量的目标类别检测器,其表现比用弱监督训练技术所产生的检测器要好得多,并且还可以进行适度的额外标注。这些检测器的执行结果实际上在一定范围内接近手动绘制边界框所训练的结果,且由于中心点击任务执行的非常快,总的标注时间缩短了9倍到18倍。

为解决上述问题,本发明提供一种基于点击监督训练的目标类别检测方法,其主要内容包括:

(一)点击监督;

(二)弱监督对象定位;

(三)众包架构;

(四)点击监督与弱监督对象定位的合并。

其中,所述的点击监督,通过点击图像中心的方法来进行图像标注,且所点击点可以从所使用的检测器训练框架中分开独立获取。这些所点击点为完整的边界框提供可靠的定位点,因为它们对边界框的中心进行了估计。此外,还可以要求两个不同的标注者对同一个目标进行中心点击,即双击监督。由于它们的误差是独立的,故可以通过对所点击点的位置进行平均计算以获得目标中心位置的更准确的估计值,且两个所点击的点之间的距离随物体大小增加而增加,因此这样可以根据所点击点之间的距离估算目标的大小。

进一步地,所述的弱监督目标定位,从一组仅仅包含一个特定目标类别而没有给出目标位置的图像来训练出定位方法,从而在学习一个目标检测器的同时在这些图像中定位目标,这样就能够在新的测试图像中对实体进行定位。

进一步地,所述的众包架构,首先让标注者先读取由图像及其目标类别名称组成的指令集,然后需要通过一个交互式的训练阶段,其中包含一个基于合成多边形的合格性测试。在完成这个阶段后,标注者会收到一个详细的关于他们在测试中表现的反馈报告,这其中通过合格性测试的标注者就可以进入到图像标注阶段。这里在标注者训练这个阶段中,标注者可以不断重复合格性测试以防失败。最后就是进行数据收集工作,需要收集的数据包括标注时间,标注误差以及标注成本。

其中,所述的标注者训练,通过合格性测试过滤掉不好的标注者从而提高众包数据的质量。在合格性测试期间,标注者需要点击20个合成多边形的中心。这里使用合成多边形代替实际物体不仅保证了合格性测试的难度,还减少了标注者的认知负荷,从而使训练阶段更有效率。在标注者完成合格性测试之后,他们会收到一个反馈页面,其中包含所有已标注的合成多边形实例,其中每个多边形上都会显示其真实中心的位置,标注者自己点击的位置以及这两者之间的欧几里得距离(误差距离)。通过这项测试的确切标准是在测试中的所有多边形上的平均误差距离低于20个像素。通过合格性测试的标注者会被记录为合格标注者,然后他们可以继续进行主要标注任务来处理真实图像。这里允许标注者不断重复合格性测试直到他们通过为止。通过把丰富的反馈结果与重复测试相结合,这个标注者训练阶段具备了较高的互动性与效率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710431113.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top