[发明专利]一种文本图像二值化的优化方法有效

专利信息
申请号: 201510257271.X 申请日: 2015-05-13
公开(公告)号: CN104866850B 公开(公告)日: 2018-11-02
发明(设计)人: 高协平;张胜龙;胡凯 申请(专利权)人: 湘潭大学
主分类号: G06K9/38 分类号: G06K9/38
代理公司: 暂无信息 代理人: 暂无信息
地址: 411105 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 图像 二值化 优化 方法
【说明书】:

发明公开了一种文本图像二值化的优化方法,本发明具有如下的技术效果,(1)本发明提出了一种优化二值化的方法。现有的二值化算法,对于不同退化类型的文本图像,都有着自己不同的特点和准确度,而本发明能够很好的在现有二值图的基础上进行二次优化,保留二值化算法自身的优点,进一步提升二值化方法的准确度。(2)本发明提出了一种以每个区域中、每一行或者每一列像素中某一类作为特征的像素所占的百分比作为判断其中所有像素分类的方法,不仅仅可以用到该发明中,对于很多其它需要细致分类的情况,在已经初步得到分类信息的情况下,都能够很好的借鉴此方法进行二次分类。

技术领域

本发明涉及一种文本图像的二值化优化方法,属于图像处理领域。

背景技术

目前纸质的文献资料随着时间的发展越来越多,需要占用越来越多的地方来存放,且使用搜索起来也不方便,因此需要将其数字化后存储以便于传播、管理与应用。文本图像的数字化,需要对字符进行分割、识别等步骤,而在进行这些操作之前,需要对文本图像进行二值化,二值化的准确度直接影响着随后的分析、识别等步骤能否顺利进行,所以,文本图像的二值化扮演着至关重要的角色。文本图像的二值化,是将一幅文本的灰度图像,转换为只有黑白两色的二值图像,即将图像分为前景和背景两部分。许多文本图像是年代久远的文献资料,难以避免会发生图像退化,发生退化的原因有很多种,比如图像的获取来源,图像的保存环境、保存时间等等,都会使图像发生严重的退化现象,使得文本图像中前景与背景高度相似,难以区分,因而如何准确的对文本图像进行二值化一直是一道难题。

二值化算法,通过最近十多年的发展,已经有了很大的进步。但是对于历史文本图像,通常图像退化比较严重,图像质量较差。而退化类型有各种各样,比如光照变化,污渍,折痕,背面浸透过来的字迹等等,现有的二值化算法,对各种类型的退化文本图像都有自己的不同的特点且准确度不一。因而本文希望能够提高现有二值化算法对于各种类型的退化文本的适应性,在现有二值化算法得到的二值图的基础上,进行二次优化,进一步提高二值化的准确度。

发明内容

本发明的目的是提供一种对文本图像二值化的优化方法。

本发明的技术方案是,

一种文本图像二值化的优化方法,包括以下步骤:

步骤1:

用二值化算法对原始文本图像进行二值化后得到的二值图,作为初始二值图;

对原始文本图像运用k-means算法,以图像的所有像素点的像素值为对象进行分类,分类的数目设为k,分类以后就能得到一幅被标记为{I1,I2,I3…Ii}k类像素集合的图像,每个像素被标记为1~k中的一类,计算每个Ii集合中所有像素值的平均值Ai,记Imin即为像素值均值最小的一类像素集合;

步骤2:

采用R.M.haralick连通区域检测算法在初始二值图中标记出每一个独立封闭的连通区域,连通区域是指图像中的一个最大连通子集,在一个最大连通子集中任意两个像素点P1(x1,y1)满足:

1≤(x1-x2)2+(y1-y2)2≤2 (1)

得到一幅大小与初始二值图相同且被标记为1~m个连通区域的图像;

步骤3:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湘潭大学,未经湘潭大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510257271.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top