[发明专利]一种基于点击监督训练的目标类别检测方法在审
申请号: | 201710431113.0 | 申请日: | 2017-06-08 |
公开(公告)号: | CN107273891A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 点击 监督 训练 目标 类别 检测 方法 | ||
1.一种基于点击监督训练的目标类别检测方法,其特征在于,主要包括点击监督(一);弱监督目标定位(二);众包架构(三);点击监督与弱监督目标定位的合并(四)。
2.基于权利要求书1所述的点击监督(一),其特征在于,通过点击图像中心的方法来进行图像标注,且所点击点可以从所使用的检测器训练框架中分开独立获取,这些所点击点为完整的边界框提供可靠的定位点,因为它们对边界框的中心进行了估计;此外还可以要求两个不同的标注者对同一个目标进行中心点击,即双击监督;且由于它们的误差是独立的,故可以通过对所点击点的位置进行平均计算以获得目标中心位置的更准确的估计值,且两个所点击的点之间的距离随物体大小增加而增加,因此这样可以根据所点击点之间的距离估算目标的大小。
3.基于权利要求书1所述的弱监督目标定位(二),其特征在于,从一组仅仅包含一个特定目标类别而没有给出目标位置的图像来训练出定位方法,从而在学习一个目标检测器的同时在这些图像中定位目标,这样就能够在新的测试图像中对实体进行定位。
4.基于权利要求书1所述的众包架构(三),其特征在于,让标注者先读取由图像及其目标类别名称组成的指令集,然后需要通过一个交互式的训练阶段,其中包含一个基于合成多边形的合格性测试;在完成这个阶段后标注者会收到一个详细的关于他们在测试中表现的反馈报告,这其中通过合格性测试的标注者就可以进入到图像标注阶段,这里在标注者训练这个阶段中,标注者可以不断重复合格性测试以防失败;最后就是进行数据收集工作,需要收集的数据包括标注时间,标注误差以及标注成本。
5.基于权利要求书4所述的标注者训练,其特征在于,通过合格性测试过滤掉不好的标注者从而提高众包数据的质量,其中在合格性测试期间,标注者需要点击20个合成多边形的中心,这里使用合成多边形代替实际物体不仅保证了合格性测试的难度,还减少了标注者的认知负荷,从而使训练阶段更有效率;在标注者完成合格性测试之后,他们会收到一个反馈页面,其中包含所有已标注的合成多边形实例,其中每个多边形上都会显示其真实中心的位置,标注者自己点击的位置以及这两者之间的欧几里得距离(误差距离),通过这项测试的确切标准是在测试中的所有多边形上的平均误差距离低于20个像素;通过合格性测试的标注者会被记录为合格标注者,然后他们可以继续进行主要标注任务来处理真实图像,这里允许标注者不断重复合格性测试直到他们通过为止,通过把丰富的反馈结果与重复测试相结合,这个标注者训练阶段具备了较高的互动性与效率。
6.基于权利要求书4所述的图像标注,其特征在于,标注者需要对20个连续出现的图像进行批量标注,且这里每批的图像都是单独的目标类别,这样就在提高标注准确度的同时减少标注时间;此外此阶段还采用了质量控制方法,即在每批次的20个图像中包含两个隐藏了已经标注好边界框的评估图像,从而监视标注者的标注准确度,这里未达到所要求标注准确度的标注者将不能提交当前数据。
7.基于权利要求书4所述的数据收集,其特征在于,通过记录从图像出现开始直到标注者进行点击的时间作为标注时间,并以此体现标注者的标注效率;通过记录标注者的所点击点与实际边界框中心的距离来测得误差距离,并以此体现标注者的标注准确度;最后是通过记录标注者每标注一批图像所需支付的金额来体现总体的标注成本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710431113.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:针对字符组合的图形验证码识别方法及装置
- 下一篇:一种车牌字符分割方法及装置