[发明专利]图像处理装置和方法有效
申请号: | 201110209866.X | 申请日: | 2011-07-19 |
公开(公告)号: | CN102890780A | 公开(公告)日: | 2013-01-23 |
发明(设计)人: | 郑大念;孙俊;直井聪 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/38 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;陈炜 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 装置 方法 | ||
技术领域
本发明涉及图像处理装置和方法,具体涉及用于识别图像中的笔画和线条的图像处理装置和方法。
背景技术
把文字和图片从文档图像中分离出来是一种很有用的技术,可用于文档布局分析、文档图像分层压缩等。已有的商业化的产品包含一种文档图像压缩技术,例如在彩色模式300DPI采样的条件下,它能够把一典型的杂志页压缩到40~60KB,这种压缩率大约是JPEG压缩率的5-10倍,而且保持了主观上相近的图像质量。典型的现有图像压缩技术的首要阶段是通过二维的隐马尔可夫模型把前景(文字)和背景(图片和文档背景)分开。它在前景分离的初始阶段,往往导致过分割,于是应用一些不同的滤波器删除大多数的明显错误。
发明内容
根据本发明的一个实施例,提供一种图像处理装置,包括:局部均值图生成部分,被配置为生成所要处理的图像的局部均值图;二值化图生成部分,被配置为生成该图像的二值化图,在二值化图中,与该图像中的高频区域相对应的像素具有第一灰度,而与该图像中的低频区域相对应的像素具有第二灰度;三值化图生成部分,被配置为根据该图像与局部均值图的比较,将二值化图中具有第一灰度的区域划分为具有第一灰度的区域和具有第三灰度的区域,从而生成三值化图;填充部分,被配置为识别三值化图中具有第二灰度的连通区域,并且在连通区域的边界处具有第一灰度的像素与具有第三灰度的像素的数量比大于预定阈值时,以第一灰度填充该连通区域,而在连通区域的边界处具有第三灰度的像素与具有第一灰度的像素的数量比大于该预定阈值时,以第三灰度填充该连通区域;以及识别部分,被配置为根据经填充的三值化图中对象边界处的灰度一致性来识别图像中的笔画和/或线条。
根据本发明的另一个实施例,提供一种图像处理方法,包括步骤:生成所要处理的图像的局部均值图;生成该图像的二值化图,在二值化图中,与该图像中的高频区域相对应的像素具有第一灰度,而与该图像中的低频区域相对应的像素具有第二灰度;根据该图像与局部均值图的比较,将二值化图中具有第一灰度的区域划分为具有第一灰度的区域和具有第三灰度的区域,从而生成三值化图;识别三值化图中具有第二灰度的连通区域,并且在连通区域的边界处具有第一灰度的像素与具有第三灰度的像素的数量比大于预定阈值时,以第一灰度填充该连通区域,而在连通区域的边界处具有第三灰度的像素与具有第一灰度的像素的数量比大于该预定阈值时,以第三灰度填充该连通区域;以及根据经填充的三值化图中对象边界处的灰度一致性来识别该图像中的笔画和/或线条。
根据本发明的图像处理装置和方法例如具有以下特点:
既能够识别浅色背景上的深色文字,也能识别深色背景上的浅色文字;
能够同时识别各种大小字号的文字,且能够同时识别各种笔画粗细的文字;
对文字的识别不受语种的限制;
能够识别表格或线条。
附图说明
参照以下结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。为了避免因不必要的细节而模糊了本发明,在附图中仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明关系不大的其它细节。
图1示出根据本发明实施例的图像处理装置的配置的示例;
图2A示出图像处理对象的示例;
图2B示出图2A所示的图像的局部均值图;
图2C示出图2A所示的图像的局部方差图;
图2D示出根据图2A所示的图像及其局部均值图生成的三值化图;
图2E示出经填充的图2D的三值化图;
图2F示出从图2E的经填充的三值化图中识别出的对象;
图3A示出对浅色背景上的深色文字进行识别的具体示例;
图3B示出对深色背景上的浅色文字进行识别的具体示例;
图4示出对不包含笔画和线条的图像部分的处理结果的示例;
图5是示出根据本发明另一实施例的图像处理装置的配置示例的框图;
图6A至图6C是示出对四值化图进行定向膨胀的示例;
图7A和图7B示出从四值化图像中分离出的文字的示例;
图8A和图8B示出根据本发明实施例的图像处理装置对包含图形、文字以及线条的图像的处理结果的示例;
图9示出根据本发明实施例的图像处理方法的流程图;
图10示出根据本发明另一实施例的图像处理方法的流程图;以及
图11是示出其中实现本发明的装置和方法的计算机的示例性结构的框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110209866.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:环保节能立式沸腾锅炉
- 下一篇:一种设备合法性检验的方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序