[发明专利]基于特殊锚点的双页文本图像识别及定位分割方法有效
| 申请号: | 201910825447.5 | 申请日: | 2019-09-03 |
| 公开(公告)号: | CN110532973B | 公开(公告)日: | 2022-02-01 |
| 发明(设计)人: | 徐行;张鹏飞;张东祥;陈李江 | 申请(专利权)人: | 海南阿凡题科技有限公司 |
| 主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V10/44 |
| 代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
| 地址: | 571924 海南省海口市老城高*** | 国省代码: | 海南;46 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 特殊 文本 图像 识别 定位 分割 方法 | ||
1.一种基于特殊锚点的双页文本图像识别方法,其特征在于,该识别方法包括以下步骤:
步骤A100,获取待识别的文本图像,作为输入图像;
步骤A200,对所述输入图像进行二值化处理,并提取该图像中前景区域的轮廓线;
步骤A300,获取所述轮廓线对应的最小外接矩形,并获取距离所述最小外接矩形纵向中轴线最近的两个锚点,将其作为特殊锚点;分别将两个特殊锚点与所述最小外接矩形纵向边的距离与距离阈值进行对比,将大于所述距离阈值的锚点作为异常锚点;所述距离阈值为设定系数与所述最小外接矩形纵向边的长度的乘积;
若所述异常锚点的数量为0或1,则判定所述输入图像为双页文本图像,否则所述输入图像为单页文本图像。
2.根据权利要求1所述的基于特殊锚点的双页文本图像识别方法,其特征在于,步骤A200中“提取该图像中前景区域的轮廓线”,其方法为:采用canny算法对二值化处理后的输入图像进行边缘检测,检测完成后通过findcontours函数提取所述输入图像中前景区域的轮廓线。
3.根据权利要求1所述的基于特殊锚点的双页文本图像识别方法,步骤A300中“获取距离所述最小外接矩形纵向中轴线最近的两个锚点,将其作为特殊锚点”,其方法为:
获取所述前景区域的轮廓线上的点,构建点集合;
根据所述点集合中点i与前一个点i-1、后一个点i+1的关系,将符合预设条件(i+1).x!=i.x&&(i+1).y!=i.y&&(i-1).x!=i.x&&(i-1).y!=i.y或(i-1).x==i.x&&abs((i-1).y-i.y)<3&&abs((i+1).x-i.x)==1&&(i+1).y!=i.y或(i+1).x==i.x&&abs((i+1).y-i.y)<3&&abs((i-1).x-i.x)==1&&(i-1).y!=i.y的点i作为锚点;
根据所述最小外接矩形的中心点的y坐标,将大于所述y坐标的锚点中距离所述最小外接矩形纵向中轴线最近的锚点和小于所述y坐标的锚点中距离所述最小外接矩形纵向中轴线最近的锚点作为特殊锚点。
4.一种基于特殊锚点的双页文本图像定位分割方法,其特征在于,基于权利要求1-3任一项所述的基于特殊锚点的双页文本图像识别方法,该方法包括以下步骤:
步骤S100,获取待分割的双页文本图像,作为输入图像;
步骤S200,对所述输入图像进行二值化处理,并提取该图像中前景区域的轮廓线;
步骤S300,获取所述轮廓线对应的最小外接矩形,并获取距离所述最小外接矩形纵向中轴线最近的两个锚点,将其作为特殊锚点;
步骤S400,根据步骤S300获取的两个特殊锚点确定分割线位置,对所述最小外接矩形进行分割,得到分割结果;
其中,“根据步骤S300获取的两个特殊锚点确定分割线位置”,其方法为:
步骤S410,判断两个特殊锚点为异常锚点的数量,若异常锚点的数量为1,则将为异常锚点的特殊锚点删除;基于预设数z,计算另一特殊锚点i到点i-z的距离d1、点i+z的距离d2,若d1大于d2,则将该特殊锚点进行左移补偿,若d1小于d2,则将所述特殊锚点进行右移补偿;基于所述最小外接矩形纵向边的斜率、补偿后的特殊锚点,得到补偿后的特殊锚点在所述轮廓线上对应的另一特殊锚点;
步骤S420,若异常锚点的数量为0,通过步骤S410的左移或右移补偿方法分别对两个特殊锚点进行补偿,得到补偿后的两个特殊锚点;
步骤S430,基于步骤S410或者步骤S420得到的两个特殊锚点,确定分割线的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南阿凡题科技有限公司,未经海南阿凡题科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910825447.5/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





