[发明专利]用于关联视频中的目标的方法在审

申请号：	201880099421.0	申请日：	2018-09-11
公开（公告）号：	CN112970031A	公开（公告）日：	2021-06-15
发明（设计）人：	V·格兰查罗夫;S·施韦里松;C·基努蒂亚	申请（专利权）人：	瑞典爱立信有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/62;G06K9/00
代理公司：	中国专利代理(香港)有限公司 72001	代理人：	叶晓勇;姜冰
地址：	瑞典斯***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于关联视频中的目标方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种用于关联视频（V）中的目标的计算机实现的方法（300），视频（V）包括连续帧（F_n‑1，F_n），所述方法包括：获得先前帧（F_n‑1）的第一目标建议区域信息，确定当前帧（F_n）的第二目标建议区域信息，其中，第一和第二目标建议区域信息至少指明相应帧的每个目标建议区域的外观度量、空间位置和检测概率，通过至少将先前帧（F_n‑1）的目标建议区域（111，121，131，141）的第一集合关联到当前帧（F_n）的目标建议区域（151，161，171，181）的第二集合来关联视频（V）中的目标，其中，使用基于外观度量、空间位置和检测概率计算的距离度量（D_n,n‑1）来关联目标建议区域。

技术领域

本发明涉及一种用于关联视频中的目标的方法。本发明进一步涉及一种执行该方法的计算机。

背景技术

视觉目标检测器（例如以计算机或视频处理器的形式）可用来自动识别和定位可能出现在视频帧中的目标。目标检测器通常提供目标的位置、目标的大小和目标的类型，或者这些项的任何组合。目标的类型可被辨认为目标类，例如车辆、人、动物或者建筑物。自动识别和定位帧中的目标是许多增强现实（AR）和安全应用中的必要步骤。一些现有技术的目标检测器是基于卷积神经网络（CNN）。

一个示例可见于S. Ren、K. He、R. Girshick和J. Sun的“Faster R-CNN: Towards real-time object detection with region proposal networks”（IEEE Trans.Pattern Analysis and Machine Intelligence，2017）。另一示例可见于W. Liu、D.Anguelov、D. Erhan、C. Szegedy、S. Reed、C. Fu和A. Berg的“SSD: Single shot multibox detector”（在Proc. European Conference Computer Vision，2016中）。又一示例可见于J. Redmon和A. Farhadi的“YOLO9000: Better, faster, stronger”（在Proc.IEEE Conf. Computer Vision and Pattern Recognition，2017中）。

此类常规系统的缺点在于：它们可能遭受目标身份或者踪片（tracklet）身份切换。这可能通常发生在两个或更多目标靠近在一起（例如两个足球运动员争夺球）时。这归因于：事实上，此类系统通常单独地在视频中的相继或连续帧的每帧上应用视觉目标检测器，从而忽略了连续帧中目标之间的时间关系；或者事实上，视觉场景从一帧到另一帧缓慢地演变。

使用帧之间共享的信息来改进常规目标检测器的精确度的简单尝试是：在当前帧中应用判定阈值之前，平滑检测概率和所建议的区域坐标。上面提到的平滑检测概率的方法的缺点在于：它具有低精确度，并且可能不够精确。例如，如果目标的检测概率在几帧里跌到低于硬检测概率阈值，尽管事实上跨帧的视觉目标外观在视觉上几乎不变，也仍然可能容易丢失目标。

因此，存在对于改进的方法和计算机的需要。

发明目的

本发明的实施例的目的是要提供减轻或解决上述缺点的解决方案。

发明内容

上述目的通过本文描述的主题来达成。本文描述本发明的进一步有利实现形式。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于瑞典爱立信有限公司，未经瑞典爱立信有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201880099421.0/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于关联视频中的目标的方法在审

专利文献下载