[发明专利]基于内容的文本图像颠倒判断及校正方法有效

专利信息
申请号: 201811192521.6 申请日: 2018-10-13
公开(公告)号: CN109409363B 公开(公告)日: 2021-11-12
发明(设计)人: 林嘉宇;刘荧 申请(专利权)人: 长沙芯希电子科技有限公司
主分类号: G06K9/32 分类号: G06K9/32
代理公司: 国防科技大学专利服务中心 43202 代理人: 王文惠
地址: 410073 湖南省长*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 内容 文本 图像 颠倒 判断 校正 方法
【说明书】:

发明提供一种基于内容的文本图像颠倒判断及校正方法。技术方案包括下述步骤:S1,对文本图像进行行切分;S2,剔除非文字行,保留文字行;S3,取任意文字行L,使得文字行L的长度满足设定的范围;S4,对文字行L进行光学字符识别,计算文字行L的代价函数值;S5,颠倒文字行L得到文字行L1;S6,对文字行L1进行光学字符识别,计算文字行L1的代价函数值;S7,根据文字行L的代价函数值和文字行L1的代价函数值,判断文字行L是否颠倒;如果文字行L颠倒,则进行颠倒校正。本发明主要的用途之一是处理文本图像倾斜校正后可能存在的文本图像颠倒问题,具有高正确率,易于实用等特点。

技术领域

本发明涉及文本图像处理技术领域,尤其是涉及一种文本图像颠倒的自动判断及校正方法。

背景技术

图像是信息时代最重要的信息载体之一。图像处理技术中,文本图像预处理和分析,已应用到诸如教育电子、文秘办公等行业,有重要的意义和作用。

文本图像预处理中,摄取的文本图像,一般情况下,会是倾斜的;但在后续的分析中,如对文本图像进行文字识别的OCR(Optical Character Recognition,光学字符识别)过程中,通常却要求待识别的字符是规范的、端正的。因此,文本图像的倾斜校正,是OCR之前的文本图像预处理的重要内容,是文本图像的行切割、字符定位等版面分析和最终的OCR正确率的重要保障。

目前,在计算文本图像真实倾斜角度时,如果摄取的文本图像的真实倾斜角度较大,计算出的文本图像倾斜角度可能是文本图像真实倾斜角度的补角。利用这个结果对文本图像进行倾斜校正,得到的图像就会是真实文本图像的颠倒图。

因此,在使用经过倾斜校正的文本图像进行版面分析和OCR之前,有必要先进行文本图像的颠倒判断和校正。鉴于此,特提出本发明。

发明内容

本发明的目的在于,针对可能存在文本颠倒的文本图像,提出一种基于内容的文本图像颠倒判断及校正方法。这种方法充分利用文本的字、词、词组等文法特性,判断文本图像是否颠倒,实现对颠倒文本图像的校正。

为实现所述目的,本发明的技术解决方案是:一种基于内容的文本图像颠倒判断及校正方法,设文本图像已经过倾斜校正,其特征在于,包括以下步骤:

S1:对文本图像进行行切分;

S2:剔除非文字行,保留文字行;

S3:取任意文字行L,使得文字行L的长度满足设定的范围;

S4:对文字行L进行OCR,计算文字行L的代价函数值;

S5:颠倒文字行L得到文字行L1

S6:对文字行L1进行OCR,计算文字行L1的代价函数值;

S7:根据文字行L的代价函数值和文字行L1的代价函数值,判断文字行L是否颠倒;如果文字行L颠倒,则进行颠倒校正。

与现有技术相比,本发明的有益效果在于:

(1)根据对现有文献的检索,尚未发现有关对文本图像进行颠倒判断和校正的资料,但是实际使用中却经常碰到这个问题。因此,本发明处理文本图像倾斜校正后可能存在的文本图像颠倒问题,具有创新性和实用性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙芯希电子科技有限公司,未经长沙芯希电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811192521.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top