[发明专利]用于关联视频中的目标的方法在审
申请号: | 201880099421.0 | 申请日: | 2018-09-11 |
公开(公告)号: | CN112970031A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | V·格兰查罗夫;S·施韦里松;C·基努蒂亚 | 申请(专利权)人: | 瑞典爱立信有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06K9/00 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 叶晓勇;姜冰 |
地址: | 瑞典斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 关联 视频 中的 目标 方法 | ||
本发明涉及一种用于关联视频(V)中的目标的计算机实现的方法(300),视频(V)包括连续帧(Fn‑1,Fn),所述方法包括:获得先前帧(Fn‑1)的第一目标建议区域信息,确定当前帧(Fn)的第二目标建议区域信息,其中,第一和第二目标建议区域信息至少指明相应帧的每个目标建议区域的外观度量、空间位置和检测概率,通过至少将先前帧(Fn‑1)的目标建议区域(111,121,131,141)的第一集合关联到当前帧(Fn)的目标建议区域(151,161,171,181)的第二集合来关联视频(V)中的目标,其中,使用基于外观度量、空间位置和检测概率计算的距离度量(Dn,n‑1)来关联目标建议区域。
技术领域
本发明涉及一种用于关联视频中的目标的方法。本发明进一步涉及一种执行该方法的计算机。
背景技术
视觉目标检测器(例如以计算机或视频处理器的形式)可用来自动识别和定位可能出现在视频帧中的目标。目标检测器通常提供目标的位置、目标的大小和目标的类型,或者这些项的任何组合。目标的类型可被辨认为目标类,例如车辆、人、动物或者建筑物。自动识别和定位帧中的目标是许多增强现实(AR)和安全应用中的必要步骤。一些现有技术的目标检测器是基于卷积神经网络(CNN)。
一个示例可见于S. Ren、K. He、R. Girshick和J. Sun的“
此类常规系统的缺点在于:它们可能遭受目标身份或者踪片(tracklet)身份切换。这可能通常发生在两个或更多目标靠近在一起(例如两个足球运动员争夺球)时。这归因于:事实上,此类系统通常单独地在视频中的相继或连续帧的每帧上应用视觉目标检测器,从而忽略了连续帧中目标之间的时间关系;或者事实上,视觉场景从一帧到另一帧缓慢地演变。
使用帧之间共享的信息来改进常规目标检测器的精确度的简单尝试是:在当前帧中应用判定阈值之前,平滑检测概率和所建议的区域坐标。上面提到的平滑检测概率的方法的缺点在于:它具有低精确度,并且可能不够精确。例如,如果目标的检测概率在几帧里跌到低于硬检测概率阈值,尽管事实上跨帧的视觉目标外观在视觉上几乎不变,也仍然可能容易丢失目标。
因此,存在对于改进的方法和计算机的需要。
发明目的
本发明的实施例的目的是要提供减轻或解决上述缺点的解决方案。
发明内容
上述目的通过本文描述的主题来达成。本文描述本发明的进一步有利实现形式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞典爱立信有限公司,未经瑞典爱立信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880099421.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:指令列表生成
- 下一篇:打印材料密度异常的检测