[发明专利]一种样本数据自动生成方法、装置及存储介质在审

专利信息
申请号: 202011561818.2 申请日: 2020-12-25
公开(公告)号: CN114693902A 公开(公告)日: 2022-07-01
发明(设计)人: 党天君;金洪亮;闫凯;李宏伟;梅俊辉;王志刚;林文辉 申请(专利权)人: 航天信息股份有限公司
主分类号: G06V10/22 分类号: G06V10/22;G06V30/16;G06T17/00
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 潘雪
地址: 100195 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 样本 数据 自动 生成 方法 装置 存储 介质
【说明书】:

本申请公开了一种样本数据自动生成方法、装置及存储介质,涉及图像处理领域,用以减少收集数据时所占用的资源。该方法包括:将各待加载字段加载到背景图片的预设位置上,生成第一样本图片;将所述第一样本图片加载到预设三维模型上,得到样本模型;在三维空间对所述样本模型进行模拟拍照,得到第二样本图片。通过模拟生成平面图片,并对平面图片进行三维化,最终得到符合要求的三维OCR样本。这样,通过自动生成样本数据,可以代替现有技术中的收集数据的过程,从而减少收集数据时所占用的资源。

技术领域

本申请涉及图像处理领域,尤其涉及一种样本数据自动生成方法、装置及存储介质。

背景技术

OCR(Optical Character Recognition,光学字符识别)文字识别是一种图像识别技术,具体应用方向是身份证、火车票、发票相关的文字识别。完成OCR文字识别需要先进行收集数据的工作。

而在现有技术中,在进行数据收集的过程中,通常是通过购买,即向其它拥有相关数据的机构,如实验室、研究所购买他们手中已经有的数据;也可以向民间征集数据。

上述收集数据的方法不但耗时花费时间长、占用人力资源多以及开销大,而且当收集行为涉及敏感数据时还有可能引起法律纠纷。因此,现有收集数据的方式需要耗费大量资源。

发明内容

本申请实施例提供一种样本数据自动生成方法、装置及存储介质,用以减少收集数据时所占用的资源。

第一方面,本申请实施例提供一种样本数据自动生成方法,该方法包括:

将各待加载字段加载到背景图片的预设位置上,生成第一样本图片;

将所述第一样本图片加载到预设三维模型上,得到样本模型;

在三维空间对所述样本模型进行模拟拍照,得到第二样本图片。

上述方法,通过模拟生成平面图片,并对平面图片进行三维化,最终得到符合要求的三维OCR样本。这样,通过自动生成样本数据,可以代替现有技术中的收集数据的过程,从而减少收集数据时所占用的资源。

在一种可能的实现方式中,所述在三维空间对所述样本模型进行模拟拍照,得到第二样本图片之后,所述方法还包括:

根据所述第一样本图片中各字段的位置信息,以及所述第一样本图片和所述第二样本图片的字段位置映射关系,得到所述第二样本图片中各字段的位置信息;

将所述第一样本图片中各字段的标记信息作为所述第二样本图片中各字段的标记信息;

将所述第二样本图片的位置信息和标记信息与所述第二样本图片对应保存;其中,所述标记信息用于表示字段的含义。

上述方法,在生成样本时,同时对样本进行标注,得到样本的标注信息,可以进一步的节省标注所需的资源。

在一种可能的实现方式中,所述通过以下方法确定所述第一样本图片和所述第二样本图片的字段位置映射关系:

根据模拟拍照的拍照点坐标,计算拍照视面;

根据所述拍照视面确定所述样本模型各顶点坐标对应的投影点坐标;

根据所述样本模型各顶点坐标和对应的所述投影点坐标确定透视矩阵;

将所述透视矩阵作为所述第一样本图片和所述第二样本图片的字段位置映射关系。

上述方法,通过计算确定透视矩阵来实现模拟生成的平面图片到三维样本图片的转换。

在一种可能的实现方式中,所述字段的位置信息为字段的坐标;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011561818.2/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top