[发明专利]一种样本数据自动生成方法、装置及存储介质在审
申请号: | 202011561818.2 | 申请日: | 2020-12-25 |
公开(公告)号: | CN114693902A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 党天君;金洪亮;闫凯;李宏伟;梅俊辉;王志刚;林文辉 | 申请(专利权)人: | 航天信息股份有限公司 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V30/16;G06T17/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 潘雪 |
地址: | 100195 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 样本 数据 自动 生成 方法 装置 存储 介质 | ||
本申请公开了一种样本数据自动生成方法、装置及存储介质,涉及图像处理领域,用以减少收集数据时所占用的资源。该方法包括:将各待加载字段加载到背景图片的预设位置上,生成第一样本图片;将所述第一样本图片加载到预设三维模型上,得到样本模型;在三维空间对所述样本模型进行模拟拍照,得到第二样本图片。通过模拟生成平面图片,并对平面图片进行三维化,最终得到符合要求的三维OCR样本。这样,通过自动生成样本数据,可以代替现有技术中的收集数据的过程,从而减少收集数据时所占用的资源。
技术领域
本申请涉及图像处理领域,尤其涉及一种样本数据自动生成方法、装置及存储介质。
背景技术
OCR(Optical Character Recognition,光学字符识别)文字识别是一种图像识别技术,具体应用方向是身份证、火车票、发票相关的文字识别。完成OCR文字识别需要先进行收集数据的工作。
而在现有技术中,在进行数据收集的过程中,通常是通过购买,即向其它拥有相关数据的机构,如实验室、研究所购买他们手中已经有的数据;也可以向民间征集数据。
上述收集数据的方法不但耗时花费时间长、占用人力资源多以及开销大,而且当收集行为涉及敏感数据时还有可能引起法律纠纷。因此,现有收集数据的方式需要耗费大量资源。
发明内容
本申请实施例提供一种样本数据自动生成方法、装置及存储介质,用以减少收集数据时所占用的资源。
第一方面,本申请实施例提供一种样本数据自动生成方法,该方法包括:
将各待加载字段加载到背景图片的预设位置上,生成第一样本图片;
将所述第一样本图片加载到预设三维模型上,得到样本模型;
在三维空间对所述样本模型进行模拟拍照,得到第二样本图片。
上述方法,通过模拟生成平面图片,并对平面图片进行三维化,最终得到符合要求的三维OCR样本。这样,通过自动生成样本数据,可以代替现有技术中的收集数据的过程,从而减少收集数据时所占用的资源。
在一种可能的实现方式中,所述在三维空间对所述样本模型进行模拟拍照,得到第二样本图片之后,所述方法还包括:
根据所述第一样本图片中各字段的位置信息,以及所述第一样本图片和所述第二样本图片的字段位置映射关系,得到所述第二样本图片中各字段的位置信息;
将所述第一样本图片中各字段的标记信息作为所述第二样本图片中各字段的标记信息;
将所述第二样本图片的位置信息和标记信息与所述第二样本图片对应保存;其中,所述标记信息用于表示字段的含义。
上述方法,在生成样本时,同时对样本进行标注,得到样本的标注信息,可以进一步的节省标注所需的资源。
在一种可能的实现方式中,所述通过以下方法确定所述第一样本图片和所述第二样本图片的字段位置映射关系:
根据模拟拍照的拍照点坐标,计算拍照视面;
根据所述拍照视面确定所述样本模型各顶点坐标对应的投影点坐标;
根据所述样本模型各顶点坐标和对应的所述投影点坐标确定透视矩阵;
将所述透视矩阵作为所述第一样本图片和所述第二样本图片的字段位置映射关系。
上述方法,通过计算确定透视矩阵来实现模拟生成的平面图片到三维样本图片的转换。
在一种可能的实现方式中,所述字段的位置信息为字段的坐标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011561818.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种液力驱动的旋转动力输出机构
- 下一篇:一种安全系数高的建筑施工用吊篮
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置