[发明专利]处理图像的方法和设备无效
申请号: | 201010257664.8 | 申请日: | 2010-08-17 |
公开(公告)号: | CN102375978A | 公开(公告)日: | 2012-03-14 |
发明(设计)人: | 何源;孙俊;于浩;直井聪;堀田悦伸 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;李春晖 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 图像 方法 设备 | ||
技术领域
本发明涉及图像处理技术,并且更具体地,涉及处理图像以获得表格的模板的方法和设备。
背景技术
在许多文档成像系统中,大量的表格被扫描进计算机系统中,而计算机系统则处理所得到的文档图像以提取出相关信息。通常,表格包括预印制的格线和例如文字、符号等等的固定内容。格线围成的单元格中可以通过手工填写或机器打印来填入可变的内容。为提取所填写或打印的信息,计算机系统首先识别格线和固定内容以作为表格模板。根据表格模板可以识别文档图像中单元格的区域并且去除格线和固定内容部分以获得填入的可变内容部分,并接着识别通过人工填写或机器打印来填入的内容。
为识别表格模板并且将填写或打印的内容指派给对应的单元格,常用的技术是把文档图像注册到表格模板。在自动表格处理方法中,计算机系统需要具有针对每种要处理的表格的表格模板,其中定义有表格中格线、单元格的位置和固定内容。表格模板可以是预定义的,例如由操作人员手工输入,也可以根据输入文档图像自动生成,例如在美国专利US6886136号中公开了自动生成表格模板的方法。
发明内容
本发明的一个实施例是一种处理图像的设备。设备可以包含格线提取装置、对应关系确定装置、位置映射装置、像素值生成装置、图像生成装置和表格模板生成装置。格线提取装置可以从多个图像的每个中提取格线并且将所提取的格线拟合到实数二维空间中。对应关系确定装置可以通过将每个图像中所提取的格线与格线模板对齐来确定所拟合的格线围成的拟合单元格与格线模板的模板单元格间的对应关系。位置映射装置可以针对相对应的每对单元格,根据其间的仿射变换将模板单元格中每个像素的位置映射到实数二维空间中的实数位置。像素值生成装置可以根据图像中具有与实数位置相邻的位置的多个像素的像素值生成一个像素值,以作为与实数位置对应的模板单元格中的像素的像素值。图像生成装置可以通过合并格线模板的格线和具有所生成的像素值的模板单元格中像素,生成对应于图像的合成图像。表格模板生成装置可以根据多个图像的相应合成图像获得表格模板。
本发明的一个实施例是一种处理图像的方法。根据该方法,可以从多个图像的每个中提取格线并且将所提取的格线拟合到实数二维空间中。通过将每个图像中所提取的格线与格线模板对齐来确定所拟合的格线围成的拟合单元格与所述格线模板的模板单元格间的对应关系。针对相对应的每对单元格,根据其间的仿射变换将模板单元格中每个像素的位置映射到实数二维空间中的实数位置。根据图像中具有与实数位置相邻的位置的多个像素的像素值生成一个像素值,以作为与实数位置对应的模板单元格中的像素的像素值。通过合并格线模板的格线和具有所生成的像素值的模板单元格中像素,生成对应于图像的合成图像。根据多个图像的相应合成图像获得表格模板。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。在附图中,相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。
图1是示出根据本发明一个实施例的处理图像的设备的示例性结构的框图。
图2是示出包含表格的文档图像的示例的图。
图3是示出格线模板的一个示例的图。
图4是示出实线二维空间中拟合的格线及其所置成的拟合单元格的示例的图。
图5是示出模板单元格与拟合单元格之间的仿射变换的示意图。
图6是示出根据仿射变换从模板单元格中像素的位置实数二维空间中的实数位置的映射的示意图。
图7是示出根据平行平面间的仿射变换从模板单元格中像素的位置实数二维空间中的实数位置的映射的示意图。
图8是示出实数位置与其相邻像素位置间的关系的示意图。
图9是示出根据本发明一个实施例的处理图像的方法的示例性过程的流程图。
图10是示出根据本发明一个实施例的生成格线模板的部分的示例性结构的框图。
图11是示出根据本发明一个实施例的生成格线模板的示例性过程的示意图。
图12是示出其中实现本发明的设备和方法的计算机的示例性结构的框图。
具体实施方式
本文中所用的术语,仅仅是为了描述特定的实施例,而不意图限定本发明。本文中所用的单数形式的“一”和“该”,旨在也包括复数形式,除非上下文中明确地另行指出。还要知道,“包含”一词在本说明书中使用时,说明存在所指出的特征、整体、步骤、操作、单元和/或组件,但是并不排除存在或增加一个或多个其它特征、整体、步骤、操作、单元和/或组件,以及/或者它们的组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010257664.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有三维存储单元阵列的非易失性存储器件
- 下一篇:驱动设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序