[发明专利]电子文档生成设备及电子文档生成方法有效
| 申请号: | 200910006563.0 | 申请日: | 2009-02-19 |
| 公开(公告)号: | CN101515984A | 公开(公告)日: | 2009-08-26 |
| 发明(设计)人: | 梅田一郎;田中哲臣 | 申请(专利权)人: | 佳能株式会社 |
| 主分类号: | H04N1/387 | 分类号: | H04N1/387;G06K9/20 |
| 代理公司: | 北京怡丰知识产权代理有限公司 | 代理人: | 任之光;郭召道 |
| 地址: | 日本东京都*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 电子 文档 生成 设备 方法 | ||
技术领域
本发明总体上涉及由具有畸变的图像生成可搜索电子文档的电子文档生成设备及电子文档生成方法。
背景技术
已提出关于扫描图像校正的多种常规方法。日本专利特开第S60-65668(1958)号公报公开了一种校正书本的装订部分中的弯曲畸变的方法。日本专利特开第2002-77578号公报公开了一种进行图像校正的方法,该方法利用原稿上下两端间的距离、摄像设备与原稿间的距离及摄像设备的相对位置,来校正由于拍摄对象表面高度的不均匀而产生的所拍摄图像的畸变。
在日本专利特开第H7-93374(1995)号公报公开的技术中,对文档图像执行字符识别处理,并预先将作为字符识别结果的测试数据与示出文档图像上文本数据的相应位置的坐标信息相关联。此外,在搜索文本时,显示包含与所搜索文本相对应的部分的文档图像页。另外,在日本专利特开第H8-63583(1996)号公报公开的技术中,预先将作为对文档图像执行字符识别处理的结果的文本数据,与分辨率降低了的文档图像相关联,并寄存相关联后的结果,从而使生成可搜索的文档成为可能。
然而,在根据日本专利特开第S60-65668(1985)号公报与日本专利特开第2002-77578号公报的图像校正方法中,在校正之后,由于畸变校正变换中的估计误差所产生的校正误差导致图像中进一步产生畸变,这可能会进一步产生图像质量劣化。也就是说,当执行畸变校正处理时,估计误差等可能会产生进一步的畸变。因此,对用户而言,畸变校正之后的图像有可能比校正之前的图像更难以识别。
另一方面,当对包含畸变的文档图像执行字符识别处理时,从文档图像中提取字符的准确度可能会降低。因此,整个文档图像的字符识别准确度可能会降低。
发明内容
根据本发明的一个实施例,提供一种电子文档生成设备,该电子文档生成设备具有:校正单元,用于校正第一图像的畸变,以获得校正图像;字符识别单元,用于对包含在所述校正图像中的多个字符图像执行字符识别处理,以获得文本数据;用于求出所述第一图像中的各字符行的基线的单元;逆变换单元,用于对包含在所述校正图像中的各字符图像的位置坐标执行畸变校正逆变换,以求出所述第一图像中的各字符图像的位置坐标;用于基于由所述逆变换单元求出的所述第一图像中的各字符图像的所述位置坐标、就包含在所述第一图像中的各字符图像、求出该字符图像相对于所述基线的相对位置的单元;以及生成单元,用于生成包含有所述文本数据及所述第一图像的电子文档,其中,所述文本数据的位置是基于相对于所述基线的所述相对位置而描述的。
通过下面结合附图的对示例性实施例的说明,本发明的其他特征将变得更加清楚。
附图说明
图1是示出根据实施例1的电子文档生成设备的示例的概要的框图。
图2是示出根据实施例1的电子文档生成设备的示例的概要的系统图。
图3是示出电子文档生成处理的实施例的框图。
图4是示出电子文档生成处理的实施例的流程图。
图5A是示出输入图像的示例的一部分的图。
图5B是示出输入图像的示例的一部分的图。
图6A是示出通过旋转输入图像而获得的直立图像的示例的一部分的图。
图6B是示出通过旋转输入图像而获得的直立图像的示例的一部分的图。
图7A是示出通过对直立图像进行畸变校正变换而获得的畸变校正图像的示例的一部分的图。
图7B是示出通过对直立图像进行畸变校正变换而获得的畸变校正图像的示例的一部分的图。
图8A是示出畸变校正图像中的基于测量误差的畸变的示例的图。
图8B是示出畸变校正图像中的基于测量误差的畸变的示例的图。
图9A是示出畸变校正图像上的文本区域的示例的图。
图9B是示出畸变校正图像上的文本区域的示例的图。
图10A是示出从图9A中所示出的文本区域中获得的文本的示例的图。
图10B是示出从图9B中所示出的文本区域中获得的文本的示例的图。
图11A是示出图6A中的区域601的放大图。
图11B是示出图6B中的区域601的放大图。
图12A是示出图11A中的区域1106的放大图。
图12B是示出图11B中的区域1106的放大图。
图13A是示出设定基线及默认字符宽度的文本对象的PDF描述的示例的图。
图13B是示出设定基线及默认字符宽度的文本对象的PDF描述的示例的图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910006563.0/2.html,转载请声明来源钻瓜专利网。





