[发明专利]一种基于规则标注图片数据的方法、装置及存储介质在审
| 申请号: | 202210427984.6 | 申请日: | 2022-04-22 |
| 公开(公告)号: | CN114723940A | 公开(公告)日: | 2022-07-08 |
| 发明(设计)人: | 彭进华;韩旭 | 申请(专利权)人: | 广州文远知行科技有限公司 |
| 主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/75;G06V10/764;G06K9/62 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 李妙芬 |
| 地址: | 510000 广东省广州市广州*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 规则 标注 图片 数据 方法 装置 存储 介质 | ||
本申请属于数据标注的技术领域,公开了一种基于规则标注图片数据的方法、装置及存储介质,所述方法包括获取图片标注数据;判断标注数据是否存在原数据,原数据包括已存在的标注信息;若无原数据,在标注数据上标注所有标注框,选择其中一个标注框作为父亲框;根据所述父亲框与周围其他标注框的关联程度标注儿子框,并输出标注结果;若存在原数据,根据标注信息中的标注框原有关系对标注数据进行分类;计算标注框之间的关联程度,并根据标注框之间的关系建立二分图进行匹配;根据二分图的匹配结果输出标注结果,可以达到提高标注效率以及精度的效果。
技术领域
本申请涉及数据标注的技术领域,尤其是涉及一种基于规则标注图片数据的方法、装置及存储介质。
背景技术
数据标注是使用自动化的工具从互联网上抓取、收集数据包括文本、图片、语音等等,然后对抓取的数据进行整理与标注。
数据标注属于人工智能行业中的基础性工作,需要大量数据标注专员从事相关部分的工作以满足人工智能训练数据的需求,且标注数据的准确度会影响人工智能训练的质量。随着标注数据量和标注场景的增加,数据量基数的增加会出现标注数据的质量不佳的情况,但是数据量庞大,重新标注的成本过高。
发明内容
为此,本申请的实施例提供了一种基于规则标注图片数据的方法、装置及存储介质,能够解决现有标注方法效率低、精准度低的技术问题,具体技术方案内容如下:
第一方面,本申请的实施例提供一种基于规则标注图片数据的方法,所述方法包括:
获取图片标注数据;
判断标注数据是否存在原数据,原数据包括已存在的标注信息;
若无原数据,在标注数据上标注所有标注框,选择其中一个标注框作为父亲框;
根据所述父亲框与周围其他标注框的关联程度标注儿子框,并输出标注结果;
若存在原数据,根据标注信息中的标注框原有关系对标注数据进行分类;
计算标注框之间的关联程度,并根据标注框之间的关系建立二分图进行匹配;
根据二分图的匹配结果输出标注结果。
进一步的,计算关联程度的公式为:
F=(IoU-Ad1/2-Bp1/3)×k
其中,F为父子关系程度,IoU为父亲框与儿子框的交并比,d表示儿子框的面积与父亲框的面积的面积比,p表示儿子框立方体与父亲框立方体的体积比,k表示父亲框对应车辆与儿子框对应车辆之间的物理距离对应的父亲框对应车辆与儿子框对应车辆之间的物理距离对应的比值;A和B为预设权重。
进一步的,若存在对应的点云数据,则p由点云数据获取;
若无对应的点云数据,则p由儿子框在图片数据上的对角线距离与父亲框在图片上的对角线距离的比值确定。
进一步的,所述方法还包括:
在建立父亲框与儿子框之间的父子关系后,若存在至少两个父亲框之间有重叠,计算与所述父亲框具有父子关系的同一类的儿子框的数量,并将同一类的儿子框的数量与对应分类的预设数值进行比较;
若所述同一类的儿子框的数量多于对应分类的预设数值,重新计算该类儿子框与所述至少两个父亲框之间的相对位置,重新确定所述儿子框与父亲框的父子关系。
进一步的,所述方法还包括:
获取触发信号,判断触发信号归属儿子框或父亲框;
若触发信号归属儿子框,解除所述儿子框与父亲框的父子关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州文远知行科技有限公司,未经广州文远知行科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210427984.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:运用苔藓生态毯覆绿裸露岩质边坡的方法
- 下一篇:一种高压活动弯头加工装置





