[发明专利]调整图像四边形框检测结果的方法有效

专利信息
申请号: 201010129600.X 申请日: 2010-03-19
公开(公告)号: CN101807293A 公开(公告)日: 2010-08-18
发明(设计)人: 丁霄鹏;王巍;李平新 申请(专利权)人: 上海合合信息科技发展有限公司
主分类号: G06T5/00 分类号: G06T5/00;G06T7/00
代理公司: 上海光华专利事务所 31219 代理人: 王松
地址: 200433 上海市杨浦区复旦*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 调整 图像 四边形 检测 结果 方法
【说明书】:

技术领域

发明属于图像处理技术领域,涉及一种图像调整方法,尤其涉及一种在对 图像进行四边形框检测后调整检测得到的四边形框范围的方法。

背景技术

目前,在商务设备如扫描仪,商务手机上,开始越来越多的出现对所拍摄图 片的信息进行加工和提取的功能。这些功能一般可归结为两类:

1)白板图像的校正和增强

白板图像是对会议白板,公告牌和其他文本类矩形目标拍摄所得的图像。白 板图像中用户感兴趣的信息一般在矩形区域内,而拍摄所得的图片,首先在目标 矩形区域之外会有不需要的边缘区域,其次因为拍摄角度的问题,目标矩形区域 可能会出现不规则四边形(如图1(a)),或者缺角(如图1(b))的情况。通过对 图像的处理,将目标区域之外的部分去除,并将不规则四边形变形为规则的矩形 (如图1(c)),或者将缺角部分填平(如图1(d)),并将彩色图像转换为黑白图 像,并做图像增强操作,使文字更加清晰。

2)对文本图像中文本的识别

文本图像是对标准文本,如A4格式纸质文本,各种书籍中的页面,电影海 报等进行拍摄所得的图像。文本识别是通过文本识别引擎,对文本图像数据进行 处理,识别出图像中的文本。文本图像文本内容一般显示在矩形区域内,而拍摄 所得的图片,在目标矩形区域之外会有不需要的边缘区域,其次因为拍摄角度的 问题,目标矩形区域可能会出现不规则四边形(如图1(a)),或者缺角(如图1(b)) 的情况。为了使文本识别引擎对文本图像的识别更加准确迅速,需要通过对图像 的处理,将目标区域之外的部分去除,并将不规则四边形变形为规则的矩形(如 图1(c)),或者将缺角部分填平(如图1(d)),并将彩色文本图像转换为黑白图 像,并做图像增强操作,使图像中的文字和背景的对比更加明显。

上述两类操作都需要做四边形框检测操作。四边形框检测操作是指对所拍摄 的图像进行检测,提取目标四边形框,从而在之后的操作中,去除四边形框以外 的区域,并对该四边形框进行矩形框校正或补角操作。然而在实际操作中,自动 检测所得的四边形框范围可能不是期望结果,如图2(a),原本目标框的是虚线 范围内的部分,但实际检测到的是实线范围部分;或者如图2(b),源图中有多 个框可供抓取,目标框是左侧虚线范围部分,但实际检测到的是右侧实线范围部 分。因此,在对图像进行初次检测时候,需要提供一个交互界面供用户做目标框 的调整。

发明内容

本发明所要解决的技术问题是:提供一种在对图像进行四边形框自动检测后 进行目标框调整的方法。该方法在对用扫描仪或手机等图像处理设备所采集的图 像进行四边形框自动检测并获取四个框顶点信息之后,提供一个方便快捷的调整 方案,让使用者能够快速准确地调整目标框,以使调整后的目标框能够进行接下 来的处理,最终得到使用者预期得到的结果图像或结果文本信息。

为解决上述技术问题,本发明采用如下技术方案:

一种调整图像四边形框检测结果的方法,所述方法包括如下步骤:

步骤110,获取图像数据和图像引擎进行目的框检测所得到的数据;

步骤120,以适合屏幕的大小显示图像,在图像上绘出当前检测所得四边形 框的四条边;

步骤130,根据鼠标,触摸笔或手指点击的落点位置,计算出当前选定的供 调整的顶点;

步骤140,对图像做放大和平滑移动操作;

步骤150,根据用户鼠标,触摸笔或手指的滑动动作,实时调整顶点的位置;

步骤160,判断用户是否打开框顶点自动吸附功能,如果答案为是,则当鼠 标,触摸笔或手指松开后,自动调整当前顶点到附近最近的候选框顶点位置,转 到步骤170;如果答案是否,则转到步骤170;

步骤170,对图像做缩小操作,以适合屏幕的大小显示图片,在图像上绘出 调整后的四边形框;

步骤180,判断用户是否继续调整其他顶点,如果答案为是,转到步骤130; 如果答案是否,则转到步骤190;

步骤190,结束。

所述步骤130包括如下步骤:

步骤310,获得点击落点在屏幕上的位置,分别计算落点到屏幕四个顶点的 距离,取其中的最大值作为最大半径参数rmax,并初始化半径r为rmax/n,n为一 设定的参数;

步骤320,以落点为圆心,以r为半径画圆;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海合合信息科技发展有限公司,未经上海合合信息科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010129600.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top