[发明专利]图像处理方法和装置有效
申请号: | 201210137925.1 | 申请日: | 2012-05-04 |
公开(公告)号: | CN103383732A | 公开(公告)日: | 2013-11-06 |
发明(设计)人: | 孙俊;潘屹峰;直井聪 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/20 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;陈炜 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 | ||
技术领域
本发明一般涉及图像处理,更具体地,涉及用于识别文档图像的取向的方法和装置。
背景技术
在对文档图像(诸如扫描页面)进行处理时,由于例如通过扫描仪、照相机等图像输入设备获取的文档图像有可能相对于其实际取向发生了旋转(例如,旋转了90°、180°、270°),因此需要对文档图像进行取向识别。下列文献提供了文档图像取向识别的方法的示例:
Ranjith Unnikrishnan,“Combined Script and Page OrientationEstimation using the Tesseract OCR engine”,ICDAR2009;
万鑫,“文本图像的校正方法”,CN 101833648A;
Zhigang Fan,“Page orientation detection based on selective character recognition”,US 2009/0274392 A1。
发明内容
传统的方法所针对的对象主要是比较标准的文档图像,但如果待处理的文档图像是图文混杂,或者以图像为主的话,上面所列举的这些方法的处理效果就不佳了。
本发明提供一种对文档图像进行取向识别方法和装置,其能够快速地以高准确度判断整个文档图像的取向。
根据本发明的一个实施例,一种图像处理方法包括步骤:生成图像的第一尺度的二值图,其中第一尺度小于图像的原始尺度;基于第一尺度的二值图,检测图像中的至少一个文本行;生成图像的第二尺度的二值图,其中第二尺度大于第一尺度;针对每个文本行,计算第一尺度的二值图中的相应部分与第二尺度的二值图中的相应部分之间的相似度,并将相似度低于预定水平的文本行作为噪声去除;针对未被去除的文本行中的一个或更多个,对第二尺度的二值图中的相应部分进行光学字符识别以确定相应文本行的文字取向;以及根据所确定的文字取向确定图像的取向。
根据本发明的另一个实施例,一种图像处理装置包括:第一尺度二值图生成部分,被配置为生成图像的第一尺度的二值图,其中第一尺度小于图像的原始尺度;文本行检测部分,被配置为基于第一尺度的二值图,检测图像中的至少一个文本行;第二尺度二值图生成部分,被配置为生成图像的第二尺度的二值图,其中第二尺度大于第一尺度;噪声去除部分,被配置为针对每个文本行,计算第一尺度的二值图中的相应部分与第二尺度的二值图中的相应部分之间的相似度,并将相似度低于预定水平的文本行作为噪声去除;光学字符识别部分,被配置为对第二尺度的二值图中的相应部分进行光学字符识别以确定相应文本行的文字取向;以及图像取向确定部分,被配置为根据所确定的文字取向确定图像的取向。
附图说明
参照以下结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。为了避免因不必要的细节而模糊了本发明,在附图中仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明关系不大的其它细节。
图1是图解根据本发明实施例的图像处理方法的流程图;
图2a和图2b是示出文本行检测的示例的示意图;
图3a至图3c是示出在水平文本行和竖直文本行重叠的情况下,基于重叠部分的文本块的取向确定噪声文本行的示例的示意图;
图4a和图4b是分别示出利用基于二值图的像素投影和笔画投影来识别噪声文本行的示例的示意图;
图5是示出基于第一尺度二值图和第二尺度二值图的比较来确定噪声文本行的示例的示意图;
图6是图解根据本发明实施例的图像处理装置的配置示例的框图;以及
图7是示出实现本发明的方法和装置的计算机的示例性结构的框图。
具体实施方式
下面参照附图说明本发明的实施例。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
下面参照图1的流程图说明根据本发明实施例的图像处理方法的处理过程。
在步骤S110,生成图像的第一尺度的二值图,其中第一尺度小于图像的原始尺度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210137925.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种色度空间变换方法
- 下一篇:跟踪糖尿病中的平均血糖的变化
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序