[发明专利]一种用于OCR识别的基于关键点定位的票据矫正方法在审
申请号: | 201911224712.0 | 申请日: | 2019-12-04 |
公开(公告)号: | CN111126382A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 段强;李锐;金长新;王芳 | 申请(专利权)人: | 山东浪潮人工智能研究院有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/38;G07D7/20 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 250100 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 ocr 识别 基于 关键 定位 票据 矫正 方法 | ||
1.一种用于OCR识别的基于关键点定位的票据矫正方法,其特征在于,
通过综合两种关键定位的方法包括基于二值化图像做连通域分析并找到最小生成矩形的关键点定位方法,以及基于局部特征匹配PatchMatch的关键点定位方法,找到至少四个关键点,并定义出它们矫正后的坐标,通过投影变换将票据进行矫正。
2.根据权利要求1所述的方法,其特征在于,
给定一个已知的票据模板和需要矫正的图像,首先对图像进行二值化,得到一个便于进行处理的二值化图像,采用OpenCV的自适应二值化方法,调整合适的阈值对图像进行二值化。
3.根据权利要求2所述的方法,其特征在于,
对于基于连通域分析和最小生成矩形的关键点定位方法,
首先要对二值化图像进行图像形态学操作,将二值化图像中所有元素在某个小区域内连成一整个连通域;
然后对二值图像做连通域分析,并使用寻找最小矩形区域的方法将各个连通域标注出来。
4.根据权利要求3所述的方法,其特征在于,
对于基于局部区域特征匹配的PatchMatch方法,首先定义出局部特征的模板,通过使用局部特征描述子对模板和图像分别进行处理,得到两批候选描述子;
在目标图像中做遍历,寻找最近邻的一个点或者最近邻的一个以上的点,然后依然将图像进行二值化并做图像形态学处理,将二值图像进行连通域分析。
5.根据权利要求4所述的方法,其特征在于,
如果一半以上模板中的点落入了某个连通域,那就定义这个连通域为寻找的模板所在区域;该区域的边、角或中心的坐标就作为关键点被提取出来。
6.根据权利要求4或5所述的方法,其特征在于,
所述描述子是多维向量,包含对一个点特征的描述,具有尺度和旋转不变形。
7.根据权利要求6所述的方法,其特征在于,
找到关键点后,定义它们所对应的矫正坐标,通过投影变换算法计算出矫正所需要的投影矩阵,得到投影矩阵后,使用OpenCV的warpPerspective函数将图像进行矫正。
8.根据权利要求7所述的方法,其特征在于,
具体实施步骤如下
第一步,获得输入图像,拍照或者扫描均可;
第二步,将图像进行自适应二值化,得到二值化图;
第三步,通过图像形态学操作将相邻区域闭合成不同连通域,并进行连通域分析;
第四步,通过最小矩形区域算法找生成矩形框,并根据所定义的矩形框特征找到目标矩形框;
第五步,定义出局部特征匹配所需要的模板,并返回执行第二、第三步;
第六步,找到大多数模板中的描述子所在的目标区域的连通域;
第七步,综合第四步和第六步的结果,找出边角或中心点作为关键点;
第八步,定义出所找关键点对应校正后图像中的位置坐标,并计算投影矩阵;
第九步,根据第八步中的投影矩阵将票据图像进行矫正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮人工智能研究院有限公司,未经山东浪潮人工智能研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911224712.0/1.html,转载请声明来源钻瓜专利网。