[发明专利]基于内容的文本图像颠倒判断及校正方法有效
申请号: | 201811192521.6 | 申请日: | 2018-10-13 |
公开(公告)号: | CN109409363B | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 林嘉宇;刘荧 | 申请(专利权)人: | 长沙芯希电子科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 王文惠 |
地址: | 410073 湖南省长*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 内容 文本 图像 颠倒 判断 校正 方法 | ||
本发明提供一种基于内容的文本图像颠倒判断及校正方法。技术方案包括下述步骤:S1,对文本图像进行行切分;S2,剔除非文字行,保留文字行;S3,取任意文字行L,使得文字行L的长度满足设定的范围;S4,对文字行L进行光学字符识别,计算文字行L的代价函数值;S5,颠倒文字行L得到文字行L1;S6,对文字行L1进行光学字符识别,计算文字行L1的代价函数值;S7,根据文字行L的代价函数值和文字行L1的代价函数值,判断文字行L是否颠倒;如果文字行L颠倒,则进行颠倒校正。本发明主要的用途之一是处理文本图像倾斜校正后可能存在的文本图像颠倒问题,具有高正确率,易于实用等特点。
技术领域
本发明涉及文本图像处理技术领域,尤其是涉及一种文本图像颠倒的自动判断及校正方法。
背景技术
图像是信息时代最重要的信息载体之一。图像处理技术中,文本图像预处理和分析,已应用到诸如教育电子、文秘办公等行业,有重要的意义和作用。
文本图像预处理中,摄取的文本图像,一般情况下,会是倾斜的;但在后续的分析中,如对文本图像进行文字识别的OCR(Optical Character Recognition,光学字符识别)过程中,通常却要求待识别的字符是规范的、端正的。因此,文本图像的倾斜校正,是OCR之前的文本图像预处理的重要内容,是文本图像的行切割、字符定位等版面分析和最终的OCR正确率的重要保障。
目前,在计算文本图像真实倾斜角度时,如果摄取的文本图像的真实倾斜角度较大,计算出的文本图像倾斜角度可能是文本图像真实倾斜角度的补角。利用这个结果对文本图像进行倾斜校正,得到的图像就会是真实文本图像的颠倒图。
因此,在使用经过倾斜校正的文本图像进行版面分析和OCR之前,有必要先进行文本图像的颠倒判断和校正。鉴于此,特提出本发明。
发明内容
本发明的目的在于,针对可能存在文本颠倒的文本图像,提出一种基于内容的文本图像颠倒判断及校正方法。这种方法充分利用文本的字、词、词组等文法特性,判断文本图像是否颠倒,实现对颠倒文本图像的校正。
为实现所述目的,本发明的技术解决方案是:一种基于内容的文本图像颠倒判断及校正方法,设文本图像已经过倾斜校正,其特征在于,包括以下步骤:
S1:对文本图像进行行切分;
S2:剔除非文字行,保留文字行;
S3:取任意文字行L,使得文字行L的长度满足设定的范围;
S4:对文字行L进行OCR,计算文字行L的代价函数值;
S5:颠倒文字行L得到文字行L1;
S6:对文字行L1进行OCR,计算文字行L1的代价函数值;
S7:根据文字行L的代价函数值和文字行L1的代价函数值,判断文字行L是否颠倒;如果文字行L颠倒,则进行颠倒校正。
与现有技术相比,本发明的有益效果在于:
(1)根据对现有文献的检索,尚未发现有关对文本图像进行颠倒判断和校正的资料,但是实际使用中却经常碰到这个问题。因此,本发明处理文本图像倾斜校正后可能存在的文本图像颠倒问题,具有创新性和实用性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙芯希电子科技有限公司,未经长沙芯希电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811192521.6/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序