[发明专利]基于特殊锚点的双页文本图像识别及定位分割方法有效

专利信息
申请号: 201910825447.5 申请日: 2019-09-03
公开(公告)号: CN110532973B 公开(公告)日: 2022-02-01
发明(设计)人: 徐行;张鹏飞;张东祥;陈李江 申请(专利权)人: 海南阿凡题科技有限公司
主分类号: G06V30/414 分类号: G06V30/414;G06V10/44
代理公司: 北京市恒有知识产权代理事务所(普通合伙) 11576 代理人: 郭文浩;尹文会
地址: 571924 海南省海口市老城高*** 国省代码: 海南;46
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 特殊 文本 图像 识别 定位 分割 方法
【权利要求书】:

1.一种基于特殊锚点的双页文本图像识别方法,其特征在于,该识别方法包括以下步骤:

步骤A100,获取待识别的文本图像,作为输入图像;

步骤A200,对所述输入图像进行二值化处理,并提取该图像中前景区域的轮廓线;

步骤A300,获取所述轮廓线对应的最小外接矩形,并获取距离所述最小外接矩形纵向中轴线最近的两个锚点,将其作为特殊锚点;分别将两个特殊锚点与所述最小外接矩形纵向边的距离与距离阈值进行对比,将大于所述距离阈值的锚点作为异常锚点;所述距离阈值为设定系数与所述最小外接矩形纵向边的长度的乘积;

若所述异常锚点的数量为0或1,则判定所述输入图像为双页文本图像,否则所述输入图像为单页文本图像。

2.根据权利要求1所述的基于特殊锚点的双页文本图像识别方法,其特征在于,步骤A200中“提取该图像中前景区域的轮廓线”,其方法为:采用canny算法对二值化处理后的输入图像进行边缘检测,检测完成后通过findcontours函数提取所述输入图像中前景区域的轮廓线。

3.根据权利要求1所述的基于特殊锚点的双页文本图像识别方法,步骤A300中“获取距离所述最小外接矩形纵向中轴线最近的两个锚点,将其作为特殊锚点”,其方法为:

获取所述前景区域的轮廓线上的点,构建点集合;

根据所述点集合中点i与前一个点i-1、后一个点i+1的关系,将符合预设条件(i+1).x!=i.x&&(i+1).y!=i.y&&(i-1).x!=i.x&&(i-1).y!=i.y或(i-1).x==i.x&&abs((i-1).y-i.y)<3&&abs((i+1).x-i.x)==1&&(i+1).y!=i.y或(i+1).x==i.x&&abs((i+1).y-i.y)<3&&abs((i-1).x-i.x)==1&&(i-1).y!=i.y的点i作为锚点;

根据所述最小外接矩形的中心点的y坐标,将大于所述y坐标的锚点中距离所述最小外接矩形纵向中轴线最近的锚点和小于所述y坐标的锚点中距离所述最小外接矩形纵向中轴线最近的锚点作为特殊锚点。

4.一种基于特殊锚点的双页文本图像定位分割方法,其特征在于,基于权利要求1-3任一项所述的基于特殊锚点的双页文本图像识别方法,该方法包括以下步骤:

步骤S100,获取待分割的双页文本图像,作为输入图像;

步骤S200,对所述输入图像进行二值化处理,并提取该图像中前景区域的轮廓线;

步骤S300,获取所述轮廓线对应的最小外接矩形,并获取距离所述最小外接矩形纵向中轴线最近的两个锚点,将其作为特殊锚点;

步骤S400,根据步骤S300获取的两个特殊锚点确定分割线位置,对所述最小外接矩形进行分割,得到分割结果;

其中,“根据步骤S300获取的两个特殊锚点确定分割线位置”,其方法为:

步骤S410,判断两个特殊锚点为异常锚点的数量,若异常锚点的数量为1,则将为异常锚点的特殊锚点删除;基于预设数z,计算另一特殊锚点i到点i-z的距离d1、点i+z的距离d2,若d1大于d2,则将该特殊锚点进行左移补偿,若d1小于d2,则将所述特殊锚点进行右移补偿;基于所述最小外接矩形纵向边的斜率、补偿后的特殊锚点,得到补偿后的特殊锚点在所述轮廓线上对应的另一特殊锚点;

步骤S420,若异常锚点的数量为0,通过步骤S410的左移或右移补偿方法分别对两个特殊锚点进行补偿,得到补偿后的两个特殊锚点;

步骤S430,基于步骤S410或者步骤S420得到的两个特殊锚点,确定分割线的位置。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南阿凡题科技有限公司,未经海南阿凡题科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910825447.5/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top