[发明专利]基于矩形框坐标变换的多方向文本行检测方法有效
申请号: | 201810179236.4 | 申请日: | 2018-03-05 |
公开(公告)号: | CN108875744B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 项欣光;张丽飞 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V10/44;G06V10/764;G06K9/62 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 朱宝庆 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于矩形框坐标变换的多方向文本行检测方法,包括:输入待检测的图像,对其拆分为Y、R、G、B通道,并得到对应的反向通道;对候选字符区域采用基于距离和相似度的连接算法进行有效字符对连接;对每一通道图像融合基于特征过滤的ER算法和基于宽高比约束的MSER算法进行候选字符的提取;对未连接的候选字符进行坐标变换,再进行字符对连接;采用基于文本行线性约束的方法进行文本行的连接;统计文本行中经过坐标变换的字符的数量,超过行内字符数的一半,则将文本行矩形框进行逆向坐标变换;采用基于模板匹配和文本行内字符统计特征的方法进行文本行的过滤,得到最终的文本行检测结果。 | ||
搜索关键词: | 基于 矩形 坐标 变换 多方 文本 检测 方法 | ||
【主权项】:
1.一种基于矩形框坐标变换的多方向文本行检测方法,其特征在于,包括以下步骤:步骤1,输入待检测的图像,对其拆分为Y、R、G、B通道,并得到对应的反向通道;步骤2,对候选字符区域采用基于距离和相似度的连接算法进行有效字符对连接;步骤3,对每一通道图像融合基于特征过滤的ER算法和基于宽高比约束的MSER算法进行候选字符的提取;步骤4,对未连接的候选字符进行坐标变换,再进行字符对连接;步骤5,采用基于文本行线性约束的方法进行文本行的连接;步骤6,统计文本行中经过坐标变换的字符的数量,超过行内字符数的一半,则将文本行矩形框进行逆向坐标变换;步骤7,采用基于模板匹配和文本行内字符统计特征的方法进行文本行的过滤,得到最终的文本行检测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810179236.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种文本识别方法及装置
- 下一篇:组合验证码的分割识别方法及其系统