[发明专利]基于OpenCV技术的票据分割方法在审
申请号: | 201711046410.X | 申请日: | 2017-10-31 |
公开(公告)号: | CN107945194A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 刘东;李波;岳永胜 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06T7/13 | 分类号: | G06T7/13;G06T7/181;G06T5/00;G06T3/00 |
代理公司: | 四川省成都市天策商标专利事务所51213 | 代理人: | 蒋金梅 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 opencv 技术 票据 分割 方法 | ||
技术领域
本发明的实施方式涉及计算机图像处理技术领域,更具体地,本发明的实施方式涉及利用OpenCV实现一种高精度、高效率、通用性强的自动分割票据的方法。
背景技术
大型公司的财务人员每天需要繁琐地处理大量的票据,随着公司业务量的提升,公司可能面临着财务人员短缺,业务处理不及时的问题,这时我们就需要借助计算机视觉中OCR技术进行自动识别和处理。然而扫描件中票据并不规则的粘贴,以常见的报销票据为例,我们往往会把许多票据混合且无规律的贴到一张或多张A4纸大小的纸张上,然后对这些粘贴票据的纸张进行扫描,再进行后续的识别处理。但是票据的OCR识别并非是以扫描件为识别单位,而是以单张票据作为一个识别单元。这里就需要使用本文所提出的票据分割方法,即对一个A4纸大小的扫描件进行处理,将上面的各个票据分割出来,并且为了提高OCR识别正确率,需要保证票据偏转角度尽可能小。
发明内容
本发明的目的是针对上述背景技术中的缺陷,提供一种基于OpenCV技术的票据分割方法,即基于计算机视觉技术,通过OpenCV实现自动分割扫描件中票据。由于处理的票据都是彩色图片,在进行矫正之前需要先进行票据图片的预处理,然后通过边缘检测算法提取出票据的轮廓信息,然后计算出轮廓信息的最小外部矩形,最后利用该矩形的其中三个顶点进行仿射变换得到最终“方正”票据。
为了达到上述的技术效果,本发明采取以下技术方案:基于OpenCV技术的票据分割方法,包括以下步骤:
步骤一:对扫描件图片进行图片预处理,所述预处理包括对扫描件图片内容的去噪处理和二值化处理,所述去噪处理包括双边滤波、中值滤波进行平滑,所述二值化处理,具体为先获取图片的灰度图内容,然后再根据合理的阈值进行二值化处理;
步骤二:利用Canny算子对扫描件进行边缘检测,得到票据在整个图片的中的票据边缘线,然后根据票据边缘线计算得到其最小外部矩形;
步骤三:根据检测到的票据边缘线和其最小外部矩形,利用Opencv中的仿射变换函数分割出单张票据。
基于OpenCV技术的票据分割方法,其大致原理是:通过opencv实现自动分割票据,由于处理的票据都是彩色图片,在进行矫正之前需要先进行票据图片的预处理,然后通过边缘检测算法提取出票据的轮廓信息即票据边缘线,再基于票据边缘线计算出其最小外部矩形;最后利用基于矩形顶点的仿射变换得到单张票据。
Opencv(Open Source Computer Vision Library)是一个基于BSD许可发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统上。它轻量级而且高效——由一系列C函数和少量C++类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。
边缘(edge)是指图像局部强度变化最显著的部分。主要存在于目标与目标、目标与背景、区域与区域(包括不同色彩)之间,是图像分割、纹理特征和形状特征等图像分析的重要基础。为了将票据从背景中识别出来,我们需要用到边缘检测,其中常见的边缘检测算法有:Sobel算子、Roberts算子、Prewitt算子、Laplacian算子、Canny算子。其中Soble算子不能将图像主题和北京严格地分开,Roberts算法对边缘定位的精度不是很高,Prewitt算子对噪声有抑制作用,但边缘检测精度仍然不够;Laplacian算子因为采用的是二阶导数,所以该算子对噪声具有无法接受的敏感性;而在本发明中所采用Canny算子在抑制噪声,和边缘检测精度都有较好的效果。
进一步的技术方案是:在步骤二中采用Canny边缘检测得到边缘信息点,再利用多边形拟合算法对边缘拟合,得到较为完整的边缘信息。
进一步的技术方案是:采用函数boundingRect(args..)对拟合后的边缘计算得一个完整的矩形框,即最小外部矩形。
本发明与现有技术相比,具有以下的有益效果:传统的图片分割技术只是通过检测目标图像的边缘,然后利用抠图技术将目标区域提取出来即可,该过程并不需要考虑角度问题。票据图像分割却恰恰相反,不仅要求准确地根据边缘提取出票据,还需要票据能够“方正”。从业务角度考虑,在分割票据时,我们就需要计算出两个重要信息:边缘信息,角度信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711046410.X/2.html,转载请声明来源钻瓜专利网。