[发明专利]确定输入图像中的矩形目标区域的方法和设备有效
申请号: | 201610307727.3 | 申请日: | 2016-05-11 |
公开(公告)号: | CN107368829B | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 李鑫;刘伟;范伟;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;吴琼 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 输入 图像 中的 矩形 目标 区域 方法 设备 | ||
本发明公开了一种确定输入图像中的矩形目标区域的方法和设备。该方法包括:获得输入图像中的水平类线段和竖直类线段;生成候选线段组合,每个候选线段组合中包括两个水平类线段和两个竖直类线段,每个候选线段组合中的线段或其延长线相交得到四个交点;根据每个候选线段组合对应的四个交点、预定参考宽高比、输入图像的相机内参数,计算每个候选线段组合对应的透视校正后矩形区域的宽高比;基于每个候选线段组合对应的宽高比与预定参考宽高比的比较,选择一个候选线段组合;以及将所选择的候选线段组合中的四个线段或其延长线包围的区域确定为矩形目标区域。
技术领域
本发明一般地涉及图像处理领域。具体而言,本发明涉及一种能够在复杂背景下确定输入图像中的矩形目标区域以进行透视校正的方法和设备。
背景技术
在现代社会中,存在有各种各样的证件、卡片、文档等,例如身份证,名片,银行卡,户口本,驾驶证,护照、派出所的户籍管理文档等。某些单位或者个人需要频繁的收集或存档这些信息,需要将这些证件、卡片、文档等留存电子件。除了一些特殊的读取工具以外,通常的电子化方法就是拍照,然后存储图像或者对图像进行识别后存储所识别的信息。
在拍照留存的过程中,往往需要解决透视变换的问题。这是因为:由于环境或设备的限制,对这些证件、卡片、文档等(矩形目标)进行拍摄时,有可能不是正对着拍摄对象的表面拍摄,而是与拍摄对象的表面的法线方向之间存在一定的角度,造成拍照结果受到倾斜的影响,这种倾斜通常被称为透视变换。为了下一步的识别和存储,必须对图像进行透视校正,然后才能进行版面分析、识别等后续处理。
传统的方法是分析拍摄的图像,找出其边缘和角点,结合矩形目标的宽度和高度信息,建立透视变换公式,进行透视校正。
但是,传统的方法要求准确的边缘和角点位置。在输入图像中矩形目标的背景复杂的情况下,难以准确定位边缘和角点位置,传统的方法就不再适用。
本发明致力于解决上述问题,在输入图像中背景复杂的情况下仍能准确确定矩形目标区域,以用于透视校正。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
本发明的目的是提出一种确定输入图像中的矩形目标区域的方法和设备。
为了实现上述目的,根据本发明的一个方面,提供了一种确定输入图像中的矩形目标区域的方法,该方法包括:获得输入图像中的水平类线段和竖直类线段;生成候选线段组合,每个候选线段组合中包括两个水平类线段和两个竖直类线段,每个候选线段组合中的线段或其延长线相交得到四个交点;根据每个候选线段组合对应的四个交点、预定参考宽高比、输入图像的相机内参数,计算每个候选线段组合对应的透视校正后矩形区域的宽高比;基于每个候选线段组合对应的宽高比与预定参考宽高比的比较,选择一个候选线段组合;以及将所选择的候选线段组合中的四个线段或其延长线包围的区域确定为矩形目标区域。
根据本发明的另一个方面,提供了一种确定输入图像中的矩形目标区域的设备,该设备包括:线段获得装置,被配置为:获得输入图像中的水平类线段和竖直类线段;候选线段组合生成装置,被配置为:生成候选线段组合,每个候选线段组合中包括两个水平类线段和两个竖直类线段,每个候选线段组合中的线段或其延长线相交得到四个交点;宽高比计算装置,被配置为:根据每个候选线段组合对应的四个交点、预定参考宽高比、输入图像的相机内参数,计算每个候选线段组合对应的透视校正后矩形区域的宽高比;选择装置,被配置为:基于每个候选线段组合对应的宽高比与预定参考宽高比的比较,选择一个候选线段组合;以及矩形区域确定装置,被配置为:将所选择的候选线段组合中的四个线段或其延长线包围的区域确定为矩形目标区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610307727.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序