[发明专利]针对多视频帧的标注方法、装置、设备和存储介质有效
申请号: | 202110362493.3 | 申请日: | 2021-04-02 |
公开(公告)号: | CN113096003B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 石佳;侯文博;李翔;李俊桥 | 申请(专利权)人: | 北京车和家信息技术有限公司 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06T7/70;G06T7/80;G06T19/20 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 任媛;刘铁生 |
地址: | 101300 北京市顺义区高丽营*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 视频 标注 方法 装置 设备 存储 介质 | ||
本申请提供一种针对多视频帧的标注方法、装置、设备和存储介质,涉及图像处理技术领域。其中,一种针对多视频帧的标注方法,包括:获取针对相同区域采集的多个视频帧;根据所述多个视频帧进行三维重建,得到所述区域对应的三维重建场景;基于所述三维重建场景进行标注,得到所述三维重建场景中的标注信息;将所述三维重建场景中的标注信息投影至多个所述视频帧中,得到多个所述视频帧中的标注信息。上述方法能够实现视频帧的批量化标注,可以有效提高多视频帧的标注效率,以及降低标注工作的人力成本。
技术领域
本申请涉及图像处理技术领域,尤其涉及一种针对多视频帧的标注方法、装置、设备和存储介质。
背景技术
在无人驾驶技术领域中,图像感知算法作为核心算法得到广泛应用,其能够基于无人驾驶设备采集的连续图像帧,采用机器学习的方式进行定位和障碍物的识别等。在机器学习的训练过程中,需要对训练样本数据所对应的图像帧中的目标物体进行标注。
目前,大多数用于图像感知算法中的标注都来源于人工标注,并且标注人员只在单帧图像上进行标注。这样的标注方式会耗费大量的人力物力,并且自动驾驶领域需要进行连续帧的标注,这样又大幅增加了标注工作量和标注成本。
鉴于上述问题,需要提供一种能够提高多视频帧的标注效率的方案。
发明内容
本申请实施例的目的是提供一种针对多视频帧的标注方法、装置、设备和存储介质,以至少解决如何提高多视频帧的标注效率的问题。
为解决上述技术问题,本申请实施例提供如下技术方案:
本申请第一方面提供一种针对多视频帧的标注方法,所述方法包括:
获取针对相同区域采集的多个视频帧;
根据所述多个视频帧进行三维重建,得到所述区域对应的三维重建场景;
基于所述三维重建场景进行标注,得到所述三维重建场景中的标注信息;
将所述三维重建场景中的标注信息投影至多个所述视频帧中,得到多个所述视频帧中的标注信息。
本申请第二方面提供一种针对多视频帧的标注装置,所述装置包括:
视频帧获取模块,用于获取针对相同区域采集的多个视频帧;
三维重建模块,用于根据所述多个视频帧进行三维重建,得到所述区域对应的三维重建场景;
三维标注模块,用于基于所述三维重建场景进行标注,得到所述三维重建场景中的标注信息;
标注投影模块,用于将所述三维重建场景中的标注信息投影至多个所述视频帧中,得到多个所述视频帧中的标注信息。
本申请第三方面提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行以实现本申请第一方面所述的方法。
本申请第四方面提供一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现本申请第一方面所述的方法。
本申请第一方面提供的一种针对多视频帧的标注方法,通过获取针对相同区域采集的多个视频帧,根据所述多个视频帧进行三维重建,得到所述区域对应的三维重建场景,然后基于所述三维重建场景进行标注,得到所述三维重建场景中的标注信息,再将所述三维重建场景中的标注信息投影至多个所述视频帧中,得到多个所述视频帧中的标注信息,相较于现有技术中需对每张视频帧分别人工标注的方式,用户只需要在三维重建场景中进行标注,即可自动将标注信息反向投影到多个视频帧中,实现视频帧的批量化标注,可以有效提高多视频帧的标注效率,以及降低标注工作的人力成本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京车和家信息技术有限公司,未经北京车和家信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110362493.3/2.html,转载请声明来源钻瓜专利网。