[发明专利]一种密集场景下的票据区域识别方法及装置在审
申请号: | 201910973913.4 | 申请日: | 2019-10-14 |
公开(公告)号: | CN110765910A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 张汉宁;苏斌;弋渤海;田福康;王长辉;张俊杰;任会;方红超 | 申请(专利权)人: | 西安网算数据科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 13130 石家庄领皓专利代理有限公司 | 代理人: | 张玉婵 |
地址: | 710000 陕西省西安市长安*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 拍摄图片 区域检测 样本集 区域信息 标注 模型获得 图像处理技术 区域边框 区域识别 中心坐标 测试 场景 | ||
本发明属于图像处理技术领域,提出了一种密集场景下的票据区域识别方法及装置,包括获取多张票据拍摄图片;获得所述票据拍摄图片上的所有标注区域,其中一个所述标注区域包含一个票据区域信息;将多张标注后的所述票据拍摄图片按数量分为样本集一和样本集二;根据所述样本集一获得训练后的票据区域检测模型;根据所述样本集二以及所述训练后的票据区域检测模型获得测试后的票据区域检测模型;根据所述测试后的票据区域检测模型获得多张所述票据拍摄图片上的所有所述票据区域信息,其中所述票据区域信息包括所述票据区域边框的中心坐标、高度及宽度。通过上述技术方案,解决了现有技术中密集场景下票据难识别的问题。
技术领域
本发明属于图像处理技术领域,涉及一种密集场景下的票据区域识别方法及装置。
背景技术
在财税领域中,业务人员往往会通过影像设备对各种类型的票据进行拍摄以获取相应的票据图片信息,这些票据图片上一般都含有多个票据区域,每个票据区域的票样还不尽相同,如存在十几个甚至更多的票据区域,要将图片中所有的票据区域检测出来是非常难的,目前该领域内能见到的方案只能解决票据区域比较少的情况,当票据区域比较多的时候效果就会非常差,具体体现在:一方面会有大量的票据区域漏检或者过检;另一方面相邻票据区域之间会存在大量的重叠区域,尤其在极端的情况下,如一张票据图片中有50~100个票样不相同的票据区域,而且票据区域间排列紧凑,传统的票据区域检测方法这个时候往往表现非常差,无法达到使用要求,所以在票据区域非常密集的情况下如何将票据图片中的票据区域分割出来是非常有挑战性的,存在着对新技术的需求。
发明内容
本发明提出一种密集场景下的票据区域识别方法及装置,解决了现有技术中密集场景下票据难识别的问题。
本发明的技术方案是这样实现的:
一种密集场景下的票据区域识别方法及装置,包括:
S1:获取多张票据拍摄图片;
S2:对每张所述票据拍摄图片进行标注并获得标注区域,其中一个所述标注区域包含一个票据区域信息;
S3:将多张标注后的所述票据拍摄图片按数量分为样本集一和样本集二;
S4:利用所述样本集一对初始票据区域检测模型进行训练,并获得训练后的票据区域检测模型;
S5:根据所述样本集二对所述训练后的票据区域检测模型进行测试并获得训练好的票据区域检测模型;
S6:根据所述训练好的票据区域检测模型获得多张所述票据拍摄图片上的所有票据区域,每个所述票据区域的票据区域信息包括该票据区域边框的中心坐标、高度及宽度。
作为进一步的技术方案,所述票据区域检测模型的训练方法包括以下步骤:
S41.获得所述样本集一中所有的标注区域的票据区域信息;
S42.判断标注区域是否为空,获得该标注区域的票据类型;
S43.计算票据区域与标注区域的重叠度;
S44.联合S42-S43三个步骤的结果作为共同约束条件,获得最佳标注区域。
作为进一步的技术方案,所述训练好的票据区域检测模型的获取方法包括以下步骤:
S51.根据所述训练后的票据区域检测模型获得所述样本集二中所有所述最佳标注区域;
S52.根据所述最佳票据区域获得与每个实际的票据区域的票据区域信息的偏差;
S53.通过调整所述票据拍摄图片的总数,获得偏差满足预设阈值范围的所述训练好的票据区域检测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安网算数据科技有限公司,未经西安网算数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910973913.4/2.html,转载请声明来源钻瓜专利网。