[发明专利]一种目标间方位关系的编码方法有效
申请号: | 201910948259.1 | 申请日: | 2019-10-08 |
公开(公告)号: | CN110705644B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 邓少冬 | 申请(专利权)人: | 西安米克斯智能技术有限公司 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/22;G06V10/72 |
代理公司: | 南京利丰知识产权代理事务所(特殊普通合伙) 32256 | 代理人: | 艾中兰 |
地址: | 710068 陕西省西安市高*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 方位 关系 编码 方法 | ||
本发明公开了一种目标间方位关系的编码方法,观察目标相对于参考目标的方位编码包括方向编码和距离编码两部分,方向编码和距离编码,都是以参考目标为出发点对观察目标的方位进行评估所获得的相对编码,因此具有不随图形缩放变化,不随观察角度改变的特点,能够有效反应出目标间的方位关系。
技术领域
本发明涉及二维空间目标间方位关系的描述和判别,可以应用于计算机视觉中目标检测后目标间相互关系的描述、生成、判别,也可以用于一般意义上的二维空间的对象间相互关系的描述、生成和判别。
背景技术
目标检测是一种计算机视觉技术,旨在从图像或者视频中检测汽车、建筑物和人类等目标。目标检测在视频监控、自动驾驶、人体跟踪等领域得到了广泛的应用。目标检测的输出包括目标的类别、可信度、目标在图像中的定位框,如图1所示,图中双虚线的定位框中包含的是狗,点状线的是自行车,点划线的是汽车。
关于目标检测和定位框的确定,业界已经有很多成熟的技术,大致可以分为两类,一类是定位框的确定和目标类别的确定分为两个不同的阶段,称为两阶段方法,代表性的算法有rcnn-》fastrcnn-》fasterrcnn等。另一类是定位框和目标类别同时确定,称为一阶段方法,代表性的算法有YOLO,SSD。
计算机视觉对于场景的理解基于场景中检测到的目标以及目标间的关系,目标检测解决了场景中有什么目标的问题,却没有关注目标间的关系。在实际应用中,目标间的关系与图像中目标的方位关系紧密相关,例如:
图2中是人扛自行车,自行车在人的上部,图3中是人骑自行车,自行车在人的下部,从计算机视觉来说,在两张图片中均检测到了人和自行车,但如何判断是人骑自行车,还是人扛自行车,则需要识别两个目标:自行车和人,二者之间的方位关系。
此外,与目标布局的相关应用,如房间、场地、商品展示等,如何将布局方式用数学方法进行描述,并将计算机所检测到的目标形成布局的描述,与标准化的布局模板进行对比,从而判断布局的正确合理性。
这里面无论是布局模板的描述,还是对目标检测后所看到的实际场景的布局是否合理进行判别,都需要一种目标间方位关系的通用描述方法,这种通用描述方法目前是缺少的。
目前业界对于判断检测到的目标间的方位关系的判别,也是基于目标定位框来实现的,包括以下几种方法:
A、IoU的方式,用来判断两个对象的重合度
如图4所示,其中有两个目标定位框,IoU(Intersection over Union,即定位框相交面积与相并面积的比值)。可见比值越接近于1,两个目标重合度越高。
B、点在框中
如图5所示,蓝色的是一个目标的定位框,一个点是否在定位框中,我们可以通过绝对坐标的大小的比较来实现。假设点坐标为(x,y),定位框x方向的最小值、y方向的最小值、x方向的最大值、y方向的最大值分别是Xmin、Ymin、Xmax、Ymax,则点在框中的条件为:
ymin<x<xmax而且ymin<y<ymax
C、绝对距离
这是一种判断定位框之间中心点距离的方式,一般将定位距离与一个阈值进行比较,作为判断是否符合条件的依据。
以上关于对象间目标方位关系的判别方法,存在以下问题:
1、不能全面描述两个目标间的方位关系,例如IoU只能反映重合度,点与框的关系只能说明是否包含特定的点;根据绝对距离对比阈值,也往往存在阈值不合理的问题;
2、依赖于代码判断。需要通过程序逻辑的方式,加上数学计算来进行判断。不同的方位关系编写不同的代码,定制性高。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安米克斯智能技术有限公司,未经西安米克斯智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910948259.1/2.html,转载请声明来源钻瓜专利网。