[发明专利]借助于初始标记的改善生成经标记的数据的方法在审
申请号: | 202011524102.5 | 申请日: | 2020-12-22 |
公开(公告)号: | CN113095351A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | A·费耶拉本德;A·布隆泽夫斯基;C·哈斯-舒茨;E·潘塞拉;H·赫特林;J·郑;J·利特克;M·高尔;R·斯大尔;S·克里希纳穆里 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 刘晗曦;刘春元 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 借助于 初始 标记 改善 生成 数据 方法 | ||
用于生成针对数据集的标记的方法,该方法包括:提供未标记的数据集,该数据集包括多个未标记的数据;针对所述未标记的数据集的数据生成初始标记;提供该初始标记作为第n个标记,其中n=1;执行迭代过程,其中针对n=1、2、3、...N的每个,所述迭代过程的第n个迭代包括如下步骤:利用经标记的数据集来训练模型以作为第n个经训练的模型,其中通过未标记的数据集的数据与第n个标记的组合来给出所述经标记的数据集;在使用第n个经训练的模型的情况下针对未标记的数据集的未标记的数据来预测第n个经预测的标记;根据至少包括所述第n个经预测的标记的标记集合来确定第(n+1)个标记。
技术领域
本公开涉及一种用于生成针对数据集的标记的方法和所述方法的用于生成训练数据的应用,其中所述训练数据用于训练模型、尤其是神经网络。
背景技术
机器学习的方法、尤其是利用神经网络、尤其是深度神经网络(英文:Deep NeuralNetworks, DNN)进行学习的方法在许多问题情况下相对于常规的、用于模式识别的、未训练的方法而言明显占优。几乎所有这些方法都基于被监督的学习。
被监督的学习需要被注释的或被标记的数据作为训练数据。这种注释在下文中也称为标记,用作针对优化算法的目标输出。在此,给每个数据元素分派至少一个标记。
标记的质量可以影响到机器学习方法的经训练的模型的识别能力(Erkennungsleistung)。从现有技术中已知:手动标记用于训练机器学习方法的样本(Stichproben)。
本公开提供一种相对于现有技术而言经改善的用于生成标记的方法。
发明内容
一种实施方式涉及用于生成针对数据集的标记的方法,该方法包括:提供未标记的数据集,所述数据集包括多个未标记的数据;针对未标记的数据集的数据生成初始标记;提供所述初始标记作为第n个标记,其中n=1;执行迭代过程,其中针对n=1、2、3、...N其中的每个而言,迭代过程的第n个迭代包括如下步骤:利用经标记的数据集来训练模型以作为第n个经训练的模型,其中通过未标记的数据集的数据与第n个标记的组合来给出经标记的数据集;在使用第n个经训练的模型的情况下针对未标记的数据集的未标记的数据来预测(prädizieren)第n个经预测的标记;根据至少包括第n个经预测的标记的标记集合来确定第(n+1)个标记。
该方法基于:从初始标记出发来改善所述初始标记和生成其他标记并且在迭代方法中逐步改善标记、尤其是标记的质量。在此,充分利用经训练模型的用于泛化(Generalisierung)的能力和/或经训练模型的经由迭代而增加的精确度。
利用该方法所生成的标记可以与数据集一起被提供作为经标记的或者经注释的用于训练模型、尤其是神经网络的训练数据。
未标记的数据集的未标记的数据例如是真实的数据、尤其是传感器的测量值、尤其是多模态的(multimodal)数据。传感器根据不完全的、示例性的列举(Aufzählung)可以例如是雷达传感器、光学摄像机、超声传感器、激光雷达传感器或者红外传感器。这种传感器通常在机动车中或一般而言的机器人中的自主和部分自主的功能中得以应用。
针对最初尚未标记的数据,生成初始标记。本公开的方法的优点是:在该步骤中有错地生成标记便是足够的。标记的生成因此可以比较简单并且因此相对快速且低成本地实现。
然后,初始标记在迭代过程的第一个迭代中作为第一个标记被使用,其中在迭代过程的迭代中执行如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011524102.5/2.html,转载请声明来源钻瓜专利网。