[发明专利]基于深度学习的半监督数据自动标注方法、计算机设备及存储介质在审
申请号: | 202211547222.6 | 申请日: | 2022-11-29 |
公开(公告)号: | CN115759244A | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 王汝卓;王雅儒;程建伟 | 申请(专利权)人: | 武汉极目智能技术有限公司 |
主分类号: | G06N3/0895 | 分类号: | G06N3/0895;G06N3/09;G06N3/096;G06V10/764;G06V10/774;G06V10/82 |
代理公司: | 北京清大紫荆知识产权代理有限公司 11718 | 代理人: | 秦亚群 |
地址: | 430040 湖北省武汉市武汉东湖新技术开发区高新*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 监督 数据 自动 标注 方法 计算机 设备 存储 介质 | ||
1.一种基于深度学习的半监督数据自动标注方法,其特征在于,包括以下步骤:
S1、获取待标注数据集;
S2、对所述待标注数据集中部分数据人工标注,将待标注数据集划分为已标注数据集和未标注数据集;
S3、基于BEV深度学习算法对所述未标注数据集进行自动标注,获取已标注数据集和新的未标注数据集;
S4、对所述新的未标注数据集是否为空进行判断;
若所述新的未标注数据集为空,则完成待标注数据集的自动标注;
若所述新的未标注数据集不为空,则进入并执行S5;
S5、基于二分类深度学习算法,对所述新的已标注数据集和所述新的未标注数据集进行评估。
2.根据权利要求1所述的半监督数据自动标注方法,其特征在于:步骤S3中,基于BEV深度学习算法对所述未标注数据集进行自动标注,获取已标注数据集和新的未标注数据集,包括以下步骤:
S31、用预训练BEV深度学习算法对所述已标注数据集进行迁移训练,获得微调BEV深度学习算法;
S32、依据所述微调BEV深度学习算法对未标注数据集自动标注,并结合置信度阈值,将所述未标注数据集划分为高置信度数据集和低置信度数据集;
S33、将所述已标注数据集与所述高置信度数据集合并形成新的已标注数据集,将所述低置信度数据集作为新的未标注数据集并进入步骤S4中对其是否为空进行判断。
3.根据权利要求1所述的半监督数据自动标注方法,其特征在于:步骤S3中,基于BEV深度学习算法对未标注数据集进行自动标注,获取已标注数据集和新的未标注数据集,包括以下步骤:
S31、用预训练BEV深度学习算法对所述已标注数据集进行迁移训练,获得微调BEV深度学习算法;
S32、依据所述微调BEV深度学习算法对所述未标注数据集自动标注,并结合置信度阈值,将所述未标注数据集划分为高置信度数据集和低置信度数据集;
S33、将所述已标注数据集与所述高置信度数据集合并形成新的已标注数据集,并进入步骤S4中对所述低置信度数据集是否为空进行判断;
若所述低置信度数据集为空,则完成待标注数据集的自动标注;
若所述低置信度数据集不为空,则进入并执行S34;
S34、用所述微调BEV深度学习算法对所述新的已标注数据集进行有监督的训练,获得新的微调BEV深度学习算法;
S35、依据所述新的微调BEV深度学习算法对所述低置信度数据集自动标注,并结合置信度阈值,将所述低置信度数据集分为新的高置信度数据集和新的低置信度数据集;
S36、将所述新的已标注数据集与所述新的高置信度数据集合并,将所述新的低置信度数据集作为新的未标注数据集并进入步骤S4中对其是否为空进行判断;
若所述新的未标注数据集为空,则完成待标注数据集的自动标注;
若所述新的未标注数据集不为空,则进入并执行S37;
S37、重复步骤S34至S36,直至所述新的未标注数据集不为空且数据量不发生变化时进入并执行S5。
4.根据权利要求1~3任一项所述的半监督数据自动标注方法,其特征在于:所述待标注数据集中包括由帧对齐的激光点云与多目图像形成的多模态数据集。
5.根据权利要求1~3任一项所述的半监督数据自动标注方法,其特征在于:步骤S2中的所述已标注数据集中数据是人工标注并校准的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉极目智能技术有限公司,未经武汉极目智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211547222.6/1.html,转载请声明来源钻瓜专利网。