[发明专利]调整图像四边形框检测结果的方法有效
申请号: | 201010129600.X | 申请日: | 2010-03-19 |
公开(公告)号: | CN101807293A | 公开(公告)日: | 2010-08-18 |
发明(设计)人: | 丁霄鹏;王巍;李平新 | 申请(专利权)人: | 上海合合信息科技发展有限公司 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/00 |
代理公司: | 上海光华专利事务所 31219 | 代理人: | 王松 |
地址: | 200433 上海市杨浦区复旦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 调整 图像 四边形 检测 结果 方法 | ||
技术领域
本发明属于图像处理技术领域,涉及一种图像调整方法,尤其涉及一种在对 图像进行四边形框检测后调整检测得到的四边形框范围的方法。
背景技术
目前,在商务设备如扫描仪,商务手机上,开始越来越多的出现对所拍摄图 片的信息进行加工和提取的功能。这些功能一般可归结为两类:
1)白板图像的校正和增强
白板图像是对会议白板,公告牌和其他文本类矩形目标拍摄所得的图像。白 板图像中用户感兴趣的信息一般在矩形区域内,而拍摄所得的图片,首先在目标 矩形区域之外会有不需要的边缘区域,其次因为拍摄角度的问题,目标矩形区域 可能会出现不规则四边形(如图1(a)),或者缺角(如图1(b))的情况。通过对 图像的处理,将目标区域之外的部分去除,并将不规则四边形变形为规则的矩形 (如图1(c)),或者将缺角部分填平(如图1(d)),并将彩色图像转换为黑白图 像,并做图像增强操作,使文字更加清晰。
2)对文本图像中文本的识别
文本图像是对标准文本,如A4格式纸质文本,各种书籍中的页面,电影海 报等进行拍摄所得的图像。文本识别是通过文本识别引擎,对文本图像数据进行 处理,识别出图像中的文本。文本图像文本内容一般显示在矩形区域内,而拍摄 所得的图片,在目标矩形区域之外会有不需要的边缘区域,其次因为拍摄角度的 问题,目标矩形区域可能会出现不规则四边形(如图1(a)),或者缺角(如图1(b)) 的情况。为了使文本识别引擎对文本图像的识别更加准确迅速,需要通过对图像 的处理,将目标区域之外的部分去除,并将不规则四边形变形为规则的矩形(如 图1(c)),或者将缺角部分填平(如图1(d)),并将彩色文本图像转换为黑白图 像,并做图像增强操作,使图像中的文字和背景的对比更加明显。
上述两类操作都需要做四边形框检测操作。四边形框检测操作是指对所拍摄 的图像进行检测,提取目标四边形框,从而在之后的操作中,去除四边形框以外 的区域,并对该四边形框进行矩形框校正或补角操作。然而在实际操作中,自动 检测所得的四边形框范围可能不是期望结果,如图2(a),原本目标框的是虚线 范围内的部分,但实际检测到的是实线范围部分;或者如图2(b),源图中有多 个框可供抓取,目标框是左侧虚线范围部分,但实际检测到的是右侧实线范围部 分。因此,在对图像进行初次检测时候,需要提供一个交互界面供用户做目标框 的调整。
发明内容
本发明所要解决的技术问题是:提供一种在对图像进行四边形框自动检测后 进行目标框调整的方法。该方法在对用扫描仪或手机等图像处理设备所采集的图 像进行四边形框自动检测并获取四个框顶点信息之后,提供一个方便快捷的调整 方案,让使用者能够快速准确地调整目标框,以使调整后的目标框能够进行接下 来的处理,最终得到使用者预期得到的结果图像或结果文本信息。
为解决上述技术问题,本发明采用如下技术方案:
一种调整图像四边形框检测结果的方法,所述方法包括如下步骤:
步骤110,获取图像数据和图像引擎进行目的框检测所得到的数据;
步骤120,以适合屏幕的大小显示图像,在图像上绘出当前检测所得四边形 框的四条边;
步骤130,根据鼠标,触摸笔或手指点击的落点位置,计算出当前选定的供 调整的顶点;
步骤140,对图像做放大和平滑移动操作;
步骤150,根据用户鼠标,触摸笔或手指的滑动动作,实时调整顶点的位置;
步骤160,判断用户是否打开框顶点自动吸附功能,如果答案为是,则当鼠 标,触摸笔或手指松开后,自动调整当前顶点到附近最近的候选框顶点位置,转 到步骤170;如果答案是否,则转到步骤170;
步骤170,对图像做缩小操作,以适合屏幕的大小显示图片,在图像上绘出 调整后的四边形框;
步骤180,判断用户是否继续调整其他顶点,如果答案为是,转到步骤130; 如果答案是否,则转到步骤190;
步骤190,结束。
所述步骤130包括如下步骤:
步骤310,获得点击落点在屏幕上的位置,分别计算落点到屏幕四个顶点的 距离,取其中的最大值作为最大半径参数rmax,并初始化半径r为rmax/n,n为一 设定的参数;
步骤320,以落点为圆心,以r为半径画圆;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海合合信息科技发展有限公司,未经上海合合信息科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010129600.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电池锁扣机构
- 下一篇:带有多工位拉伸导轨的电池壳体切口机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序