[发明专利]数据标注和域适应模型训练方法、装置、设备及介质在审
| 申请号: | 202211404950.1 | 申请日: | 2022-11-10 |
| 公开(公告)号: | CN115661904A | 公开(公告)日: | 2023-01-31 |
| 发明(设计)人: | 张晶华;文扬;张丹 | 申请(专利权)人: | 驭势科技(北京)有限公司 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/26;G06V10/764;G06V10/774 |
| 代理公司: | 北京驰明知识产权代理有限公司 16099 | 代理人: | 武玉维 |
| 地址: | 102403 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 标注 适应 模型 训练 方法 装置 设备 介质 | ||
本公开实施例公开了一种数据标注和域适应模型训练方法、装置、设备及介质。本公开通过获取源域数据集以及目标域数据集所构建的域适应模型,以通过域适应模型中的主干网络、域适应模块依次确定各目标域数据的初始特征、目标特征,进而根据目标特征确定目标域数据的预测识别标签,实现了对各目标域数据的标注,适用于各新场景下的数据集,无需人为标注,提高了标注效率和标注质量,降低了标注成本。并且,通过域适应模型中的域适应模块确定目标特征,实现了通过域适应模块将源域数据和目标域数据进行特征空间对齐,无需通过主干网络进行特征空间对齐,避免了对主干网络的反复训练,进而解决了主干网络训练过程不稳定、难以收敛的问题。
技术领域
本公开涉及数据处理技术领域,尤其涉及一种数据标注和域适应模型训练方法、装置、设备及介质。
背景技术
深度神经网络由于具有较好的可学习性、准确率高,在各个领域被广泛应用,如,自动驾驶感知领域、自然语言处理领域等。深度神经网络要具备良好的感知能力,需要大量的标注数据进行监督训练,标注数据的数量和质量对神经网络的性能具有决定性的影响。
目前,深度神经网络训练所需的标注数据主要来源于人工标注,通过让标注人员根据制定的标注规则对点云、图像或文本等数据进行标注。同时,针对一些成熟的应用场景,也有厂商通过数据闭环的方式实现数据自动标注,但目前标注数据主要还是来源于人工标注。
然而,人工标注大量数据需要耗费较大的成本,特别是针对点云等3D数据,标注过程更加复杂,成本更高。此外,人工标注主要依赖于标注人员的主观判断,在标注过程中难以保证统一的标注标准,数据标注的质量较难保证。自动标注方法效率较高,且标注标准统一。现有的自动标注方法,大多只能针对较成熟的场景数据进行标注,对于稍有差异的新场景数据还是需要人工进行标注,不能实现完全的高效率自动标注。
因此,现有技术中存在以下技术问题:依赖人工标注的方式成本高、效率低、标注质量低;自动标注方法无法实现新场景下的数据标注。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开实施例提供了一种数据标注和域适应模型训练方法、装置、设备及介质,实现对目标域数据的标注,适用于各个新场景下的数据集,无需人为标注,提高了标注效率和标注质量,降低了标注成本。
第一方面,本公开实施例提供了一种数据标注方法,该方法包括:
获取基于源域数据集以及目标域数据集确定的域适应模型,其中,所述源域数据集包括各源域数据以及各源域数据对应的预设识别标签,所述目标域数据集包括各目标域数据;
将各所述目标域数据输入至所述域适应模型,得到所述域适应模型输出的各所述目标域数据对应的预测识别标签;
其中,所述域适应模型包括主干网络、域适应模块、域判别器以及预测输出模块,所述主干网络用于确定各所述目标域数据的初始特征,所述域适应模块用于根据各所述目标域数据的初始特征确定各所述目标域数据的目标特征,所述预测输出模块用于基于各所述目标域数据的目标特征确定各所述目标域数据对应的预测识别标签。
第二方面,本公开实施例还提供了一种域适应模型训练方法,所述方法包括:
基于源域数据集以及目标域数据集确定判别模型,其中,所述判别模型包括主干网络、预测输出模块以及域判别器,所述源域数据集包括各源域数据以及各源域数据对应的预设识别标签,所述目标域数据集包括各目标域数据;
基于所述判别模型构建域适应模型,基于所述域适应模型中的主干网络,确定所述源域数据集以及所述目标域数据集中各数据的初始特征,并基于所述域适应模型中的域适应模块以及各数据的初始特征确定各数据的目标特征;
基于各源域数据的目标特征、所述域判别器和所述预测输出模块,确定各源域数据的预测域分类标签以及预测识别标签,基于各目标域数据的目标特征以及所述域判别器,确定各目标域数据的预测域分类标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于驭势科技(北京)有限公司,未经驭势科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211404950.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:航天发动机换热器气体输送用高温合金毛细管及生产工艺
- 下一篇:自动打包封箱机
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





