[发明专利]图像标注方法、电子装置及非暂态电脑可读取储存媒体在审
申请号: | 201711285222.2 | 申请日: | 2017-12-07 |
公开(公告)号: | CN109829467A | 公开(公告)日: | 2019-05-31 |
发明(设计)人: | 蒋欣翰;陈彦霖;林谦;余兆伟;李孟灿 | 申请(专利权)人: | 财团法人资讯工业策进会 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 骆希聪 |
地址: | 中国台湾台北市*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键图像 图像帧 图形化使用者界面 相邻图像帧 多个目标 图像标注 相似度 物件 可读取储存媒体 标注信息 电子装置 非暂态 辨识 追踪 电脑 | ||
一种图像标注方法,包括:取得多个图像帧;自该多个图像帧中辨识并追踪一或多个目标物件;根据一第一挑选条件,自该多个图像帧选出多个候选关键图像帧;决定该多个候选关键图像帧的多个第一相似度指标;决定多个相邻图像帧的多个第二相似度指标;将该多个候选关键图像帧,连同该多个相邻图像帧中符合一第二挑选条件者,挑选作为多个关键图像帧;将该多个关键图像帧呈现于一图形化使用者界面,并通过该图形化使用者界面显示关于该一或多个目标物件的一标注信息。
技术领域
本发明是有关于一种图像处理方法、电子装置及非暂态电脑可读取储存媒体,且特别是有关于一种图像标注(image annotation)方法、电子装置及非暂态电脑可读取储存媒体。
背景技术
目前结合电脑视觉的深度学习(deep learning)技术已是人工智能的发展趋势。然而深度学习网络需要大量的图像标注样本,才能经由训练而产生高正确性的深度学习网络。
目前图像标注的方法大多采取人工标注。操作者需针对视频数据中的图像帧(frame)逐一框选物件,并对其输入关联的标注名称。然而当视频数据中有大量的目标物件时,此种人工标注方式不仅费时而且耗工。
发明内容
本发明提出一种图像标注方法、电子装置及非暂态电脑可读取储存媒体,可自动滤除视频数据中重复性高的无效图像帧样本,并筛选出具有物件结构多样性的关键图像帧供使用者浏览,并新增、修正标注物件,以完善图像标注的结果,进而节省图像标注所需耗费的人力。另一方面,本发明提出的技术更可导入专家经验回馈机制以提升撷取关键图像帧的正确性及强健性。
根据本发明的一方面,提出一种由包含处理器的电子装置实现的图像标注方法,包括:处理器自视频数据取得图像帧序列,图像帧序列包括多个图像帧;处理器对图像帧序列执行物件检测及追踪程序,以自这些图像帧中辨识并追踪一或多个目标物件;处理器根据第一挑选条件,自这些图像帧选出多个候选关键图像帧,其中第一挑选条件包括当一或多个目标物件中的一目标物件在这些图像帧中的图像帧中开始出现或开始消失,将此图像帧挑选作为这些候选关键图像帧之一;处理器决定这些候选关键图像帧的多个第一相似度指标,各个第一相似度指标是处理器通过相似度计算,由这些候选关键图像帧中的对应候选关键图像帧的第一协方差值以及此对应候选关键图像帧沿不同方向统计取得的多个第一方差值决定;处理器决定多个相邻图像帧的多个第二相似度指标,各个相邻图像帧与这些候选关键图像帧至少其一相邻,各个第二相似度指标是处理器通过相似度计算,由这些相邻图像帧中对应相邻图像帧的第二协方差值以及此对应相邻图像帧沿不同方向统计取得的多个第二方差值决定;处理器将这些候选关键图像帧,连同这些相邻图像帧中符合第二挑选条件者,选作多个关键图像帧,第二挑选条件包括当这些相邻图像帧中的相邻图像帧的对应第二相似度指标与邻近于相邻图像帧的候选关键图像帧的对应第一相似度指标之间的差值超过相似度门槛值,则将相邻图像帧挑选作为关键图像帧的其一;处理器将这些关键图像帧呈现于图形化使用者界面,并通过图形化使用者界面显示关于一或多个目标物件的一标注信息。
根据本发明的另一方面,提出一种非暂态电脑可读取储存媒体。非暂态电脑可读取储存媒体储存一或多个指令,此一或多个指令可供处理器执行,以使包括此处理器的电子装置执行本发明的图像标注方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人资讯工业策进会,未经财团法人资讯工业策进会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711285222.2/2.html,转载请声明来源钻瓜专利网。