[发明专利]一种密集场景下的票据区域识别方法及装置在审
申请号: | 201910973913.4 | 申请日: | 2019-10-14 |
公开(公告)号: | CN110765910A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 张汉宁;苏斌;弋渤海;田福康;王长辉;张俊杰;任会;方红超 | 申请(专利权)人: | 西安网算数据科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 13130 石家庄领皓专利代理有限公司 | 代理人: | 张玉婵 |
地址: | 710000 陕西省西安市长安*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 拍摄图片 区域检测 样本集 区域信息 标注 模型获得 图像处理技术 区域边框 区域识别 中心坐标 测试 场景 | ||
1.一种密集场景下的票据区域识别方法,其特征在于,包括以下步骤:
S1:获取多张票据拍摄图片(1);
S2:对每张所述票据拍摄图片(1)进行标注并获得标注区域(2),其中一个所述标注区域(2)包含一个票据区域信息(3);
S3:将多张标注后的所述票据拍摄图片(1)按数量分为样本集一(4)和样本集二(5);
S4:利用所述样本集一(4)对初始票据区域检测模型(10)进行训练,并获得训练后的票据区域检测模型(6);
S5:根据所述样本集二(5)对所述训练后的票据区域检测模型(6)进行测试并获得训练好的票据区域检测模型(7);
S6:根据所述训练好的票据区域检测模型(7)获得多张所述票据拍摄图片(1)上的所有票据区域(11),每个所述票据区域(11)的票据区域信息(3)包括该票据区域(11)边框的中心坐标、高度及宽度。
2.根据权利要求1所述的一种密集场景下的票据区域识别方法,其特征在于,所述训练后的票据区域检测模型(6)的获取方法包括以下步骤:
S41.获得所述样本集一(4)中所有的标注区域(2)的票据区域信息(3);
S42.判断标注区域(2)是否为空,获得该标注区域(2)的票据类型;
S43.计算票据区域(11)与标注区域(2)的重叠度;
S44.联合S42-S43三个步骤的结果作为共同约束条件,获得最佳标注区域(8)。
3.根据权利要求1所述的一种密集场景下的票据区域识别方法,其特征在于,所述训练好的票据区域检测模型(7)的获取方法包括以下步骤:
S51.根据所述训练后的票据区域检测模型(6)获得所述样本集二(5)中所有所述最佳标注区域(8);
S52.根据所述最佳票据区域(8)获得与每个实际的票据区域(11)的票据区域信息(3)的偏差;
S53.通过调整所述票据拍摄图片(1)的总数,获得偏差满足预设阈值范围的所述训练好的票据区域检测模型(7)。
4.根据权利要求1所述的一种密集场景下的票据区域识别方法,其特征在于,通过计算每个所述标注区域(2)与所述票据区域(11)的交并比获得所述标注区域(2)与所述票据区域(11)的重叠度。
5.根据权利要求1所述的一种密集场景下的票据区域识别方法,其特征在于,获得实际的票据区域信息(3)的方法为:
将票据拍摄图片(1)输入所述训练好的票据区域检测模型(7),并启动所述训练好的票据区域检测模型(7)的Web接口服务,以Base64编码的形式返回每张所述票据拍摄图片(1)的所述票据区域信息(3)。
6.根据权利要求1所述的一种密集场景下的票据区域识别方法,其特征在于,所述样本集一(4)与所述样本集二(5)数量分别为总量的80%、20%。
7.根据权利要求1所述的一种密集场景下的票据区域识别方法,其特征在于,每个所述标注区域(2)均为矩形。
8.根据权利要求3所述的一种密集场景下的票据区域识别方法,其特征在于,获得偏差满足预设阈值范围的所述训练好的票据区域检测模型(7)的方法为:
若偏差大于预设阈值范围,则增加所述票据拍摄图片(1)的总量,然后重新对初始票据区域检测模型(10)进行训练和测试,重新获得所述训练好的票据区域检测模型(7),直至偏差小于预设的阈值。
9.一种密集场景下的票据区域识别装置,其特征在于,包括:
采集模块,用于获取多张票据拍摄图片;
标注模块,用于获得所述票据拍摄图片上的所有标注区域;
分类模块,用于将多张标注后的所述票据拍摄图片按数量分为样本集一和样本集二;
训练模块,用于根据所述样本集一获得训练后的票据区域检测模型;
测试模块,用于根据所述样本集二以及所述训练后的票据区域检测模型获得训练好的票据区域检测模型;
工作模块,用于根据所述测试后的票据区域检测模型获得多张所述票据拍摄图片上的所有所述票据区域信息,其中所述票据区域信息包括所述票据区域边框的中心坐标、高度及宽度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安网算数据科技有限公司,未经西安网算数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910973913.4/1.html,转载请声明来源钻瓜专利网。