[发明专利]基于特殊锚点的双页文本图像识别及定位分割方法有效
| 申请号: | 201910825447.5 | 申请日: | 2019-09-03 |
| 公开(公告)号: | CN110532973B | 公开(公告)日: | 2022-02-01 |
| 发明(设计)人: | 徐行;张鹏飞;张东祥;陈李江 | 申请(专利权)人: | 海南阿凡题科技有限公司 |
| 主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V10/44 |
| 代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
| 地址: | 571924 海南省海口市老城高*** | 国省代码: | 海南;46 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 特殊 文本 图像 识别 定位 分割 方法 | ||
本发明属于图像处理领域,具体涉及一种基于特殊锚点的双页文本图像识别及定位分割方法、系统、装置,旨在解决现有双页文本图像识别及分割方法准确率、效率低的问题。本系统方法包括获取待识别的文本图像;提取该图像中前景区域的轮廓线;获取轮廓线对应的最小外接矩形,并获取距离最小外接矩形纵向中轴线最近的两个锚点,将其作为特殊锚点获取特殊锚点;判断特殊锚点是否为异常锚点,根据异常锚点的数量判断文本图像是单页还是双页文本图像;还包括获取双页文本图像;获取特殊锚点;根据特殊锚点确定分割线位置,对最小外接矩形进行分割,得到分割结果。本发明提高了双页文本图像识别及分割的准确率、效率。
技术领域
本发明属于图像处理领域,具体涉及一种基于特殊锚点的双页文本图像识别及定位分割方法、系统、装置。
背景技术
随着计算机以及计算机网络带宽的飞速发展,信息的传播方式由以往的文本格式转化为二进制即图像的形式。在图像的处理和应用中,有时往往对图像的某些部分或者目标感兴趣,此时需要利用图像识别和分割技术将感兴趣的目标同背景区分开来,以便于进一步的研究和分析。图像识别和图像分割是图像分析的第一步,同时也是图像处理中最困难的问题之一。可以说,图像识别和图像分割结果的好坏,直接影响对图像的理解。
现有的很多检测或者识别任务只对单页图像做识别和分割处理,但实际往往也有很多双页图像为了方便后续处理,需要在图像预处理阶段将图像中的矩形文本识别并分割开来,形成单页文本图像,若使用单页图像方法对双页文本图像进行识别、分割,会出现大量错误。一般双页图像传统方法都是手动分割页面,将双页切割成两个单页,但是这样消耗了很多时间,而且效率比较低。因此,本发明提出了一种基于特殊锚点的双页文本图像识别及定位分割方法。
发明内容
为了解决现有技术中的上述问题,即为了解决现有双页文本图像识别及分割方法对双页文本图像识别、分割准确率低、效率低的问题,本发明第一方面,提出了一种基于特殊锚点的双页文本图像识别方法,该方法包括:
步骤A100,获取待识别的文本图像,作为输入图像;
步骤A200,对所述输入图像进行二值化处理,并提取该图像中前景区域的轮廓线;
步骤A300,获取所述轮廓线对应的最小外接矩形,并获取距离所述最小外接矩形纵向中轴线最近的两个锚点,将其作为特殊锚点;分别将两个特殊锚点与所述最小外接矩形纵向边的距离与距离阈值进行对比,将大于所述距离阈值的锚点作为异常锚点;所述距离阈值为设定系数与所述最小外接矩形纵向边的长度的乘积;
若所述异常锚点的数量为0或1,则判定所述输入图像为双页文本图像,否则所述输入图像为单页文本图像。
在一些优选的实施方式中,步骤A200中“提取该图像中前景区域的轮廓线”,其方法为:采用canny算法对二值化处理后的输入图像进行边缘检测,检测完成后通过findcontours函数提取所述输入图像中前景区域的轮廓线。
在一些优选的实施方式中,步骤A300中“获取距离所述最小外接矩形纵向中轴线最近的两个锚点,将其作为特殊锚点”,其方法为:
获取所述前景区域的轮廓线上的点,构建点集合;
根据所述点集合中点i与前一个点i-1、后一个点i+1的关系,将符合预设条件(i+1).x!=i.x(i+1).y!=i.y(i-1).x!=i.x(i-1).y!=i.y或(i-1).x==i.xabs((i-1).y-i.y)3abs((i+1).x-i.x)==1(i+1).y!=i.y或(i+1).x==i.xabs((i+1).y-i.y)3abs((i-1).x-i.x)==1(i-1).y!=i.y的点i作为锚点;
根据所述最小外接矩形的中心点的y坐标,将大于所述y坐标的锚点中距离所述最小外接矩形纵向中轴线最近的锚点和小于所述y坐标的锚点中距离所述最小外接矩形纵向中轴线最近的锚点作为特殊锚点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南阿凡题科技有限公司,未经海南阿凡题科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910825447.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





