[发明专利]生成合成训练数据集的计算机实现方法和系统在审
| 申请号: | 202210684295.3 | 申请日: | 2022-06-16 |
| 公开(公告)号: | CN115482322A | 公开(公告)日: | 2022-12-16 |
| 发明(设计)人: | P.兰加拉扬;N.古普塔;A.布赖藤费尔德;A.米勒;S.舒尔茨;S.凌;T.卡默洛彻;F.贝尔 | 申请(专利权)人: | 大众汽车股份公司 |
| 主分类号: | G06T15/00 | 分类号: | G06T15/00;G06T3/40;G06T7/11;G06N3/08;G06N3/04 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张建锋 |
| 地址: | 德国沃*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 生成 合成 训练 数据 计算机 实现 方法 系统 | ||
本发明涉及一种生成用于训练机器学习计算机视觉模型的合成训练数据集的计算机实现方法,用于执行至少一个用户定义的计算机视觉任务,其中空间分辨传感器数据针对至少一个用户定义的感兴趣对象被处理和评估,包括:基于用户输入数据接收用户定义的感兴趣对象的至少一个模型,特别是2D或3D模型(10);基于用户输入数据确定至少一个渲染参数(60)并且优选地确定多个渲染参数;通过基于至少一个渲染参数(60)渲染感兴趣对象的至少一个模型(10)来生成训练图像(I2,I3)集;生成关于至少一个感兴趣对象的训练图像集(I1)的注释数据;提供包括训练图像(I2,I3)集和注释数据的训练数据集,用于输出给用户和/或用于训练计算机视觉模型。
技术领域
本发明涉及一种用于生成用于训练机器学习计算机视觉模型的合成训练数据集的计算机实现方法和系统。
背景技术
人工智能和机器学习可以很快解决许多日常问题。无论是物体检测、物体分类还是训练机器人等等。大量的时间和金钱仅用于数据生成、数据收集和数据准备的过程,这涉及到手动标记数据的过程。硬件(包括摄像头)的可用性或环境因素(如室内灯光或室外天气)等因素也起着重要作用。这需要几天、几周甚至几个月的时间,然后传递给计算机视觉工程师。计算机视觉工程师不断花费数小时来生成和收集大量数据,以创建和训练神经网络。
一旦收集到这些数据,计算机视觉工程师就必须编写机器学习算法来训练这些图像。这需要计算机视觉方面的经验和知识来编写这些算法和训练神经网络。这个过程中最大的挑战是时间和精力的消耗,以及编写机器学习算法和训练神经网络的高要求和知识。
其目的是尽可能减少这一耗时和繁琐的过程,同时使神经网络的生成和训练过程非常容易,即使对于不具备计算机视觉知识的个人也是如此。因此,需要消耗更少时间和更少人工努力的替代方案,同时使人工智能的工作易于访问和使用,而无需该领域的专门知识。
目前市场上的解决方案提供手动标记图像数据。这些解决方案来自一些公司,例如谷歌(检索自https://cloud.google.com/ai-platform/data-labeling/pricing#labeling_costs)、Scale.AI(检索自https://scale.com/)或Understand.AI(检索自https://understand.ai/)。一些公司还在基于3D数据创建合成数据。例如AI.Reverie(检索自https://aireverie.com/)或CVEDIA(检索自https://www.cvedia.com/)基于三维虚拟环境创建图像。
这些解决方案可以在短时间内创建带标签的图像,但需要建模的3D环境,这也很耗时。此外,Unity 3D还宣布创建基于云的解决方案,该解决方案可以获取CAD文件并渲染二维图像,这些图像也会被标记(请参见检索自https://unity.com/de/products/unity-simulation)。另一方面,英伟达数据集合成器(Nvidia Dataset Synthesizer)是用于虚幻引擎的附加组件(检索自https://github.com/NVIDIA/Dataset_Synthesizer)。它使用Unreal Studio渲染CAD文件,除RGB图像外,它还能够创建深度图、分割遮罩和其他用于机器学习(ML)应用程序的有用信息。
众所周知的训练神经网络的解决方案还包括使用类似谷歌的Tensor flow库,这简化了编写神经网络和训练数据的过程。但这仍然需要python等编程语言的知识,若没有这些知识这通常很难使用。对于要用于培训的通用数据集,有相当多的来源提供了密集型数据集,其中包含常用数据的图像和注释,如地理数据、来自Kaggle等来源的车辆数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大众汽车股份公司,未经大众汽车股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210684295.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





