[发明专利]一种图片中文档定位和裁切方法有效
申请号: | 201710157232.1 | 申请日: | 2017-03-16 |
公开(公告)号: | CN106951855B | 公开(公告)日: | 2020-04-10 |
发明(设计)人: | 韩智素;王珏;刘新科;谌波 | 申请(专利权)人: | 深圳市六六六国际旅行社有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
代理公司: | 深圳市中科创为专利代理有限公司 44384 | 代理人: | 谭雪婷;谢亮 |
地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 文档 定位 方法 | ||
1.一种图片中文档定位和拆切方法,包括,其特征在于:
S1:输入文档图像;
S2:对输入文档图像进行直线段检测;并对检测到的直线段进行分类,其中,包括接近水平直线段、接近竖直直线段和其他方向直线段;
S3:在接近水平直线段、接近竖直直线段中提取水平边界线段和竖直边界线段;
S4:根据提取的水平边界线段和竖直边界线段,确定文档图像四个顶点位置;
S5:根据四个顶点位置对文档图像进行裁切和扶正。
2.根据权利要求1所述的图片中文档定位和拆切方法,其特征在于:步骤S2中,在直线段检测时,是根据文档图像的边来分别检测直线段;并且,步骤S3中:接近水平直线段是相对文档图像的水平边的接近水平直线段,接近竖直直线段指是相对文档图像的竖直边的接近竖直直线段。
3.根据权利要求1或2所述的图片中文档定位和拆切方法,其特征在于:步骤S2中,具体包括:
S21:首先计算文档图像中每条线段和图像水平方向的夹角;
S22:设定文档图像的倾斜角度小于45度;在所有和文档图像水平方向夹角在45度以内的线段中,找到长度最长的一条,然后以该线段的角度作为文档的水平角度,记为Ah;并将文档的竖直方向确定为Av=Ah+90;
S23:对于每一条线段,计算其角度A和Ah及Av的差别;当|A-Ah|<15,将该线段标注为接近水平直线段;当|A-Av|<15,将该线段标注为接近竖直直线段;其他则为其他方向直线段。
4.根据权利要求3所述的图片中文档定位和拆切方法,其特征在于:步骤S3中,具体包括:
S31:将所有水平方向的线段往图像的竖直方向投影;假设图像的高度为h,那么我们就设置一个长度为h的直方图;用H来表示;对于图像中一个像素(x,y),如果该像素在某一条水平线段之上,那么H(y)的值就增加一;
S32:对于每一条线段,计算一个它在文档边缘的置信度;其中,假设一条线段长度为L,其中点的坐标为(xm,ym),那么其置信度包含以下三项:
W2=min(Lt,L)
则总的置信度为W=W1*W2*W3,其中Lt是一个长度阈值;
S33:根据所有条线段的置信度,挑选置信度W3值最大,并且,总置信度W值最大的线段作为文档顶部线段;并且,挑选置信度W3值最小,并且,总置信度W值最大的线段作为文档底部线段;
S34:根据步骤S31-S33的算法,分别计算并挑选得到文档左侧线段、以及挑选得到文档右侧线段。
5.根据权利要求4所述的图片中文档定位和拆切方法,其特征在于:步骤S4中,具体为,分别计算文档顶部线段与文档左侧线段和文档右侧线段、以及计算文档底部线段与文档左侧线段和文档右侧线段的延长相交的交点,得到文档图像的四个顶点位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市六六六国际旅行社有限公司,未经深圳市六六六国际旅行社有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710157232.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:金属管材快速冲压开口模具
- 下一篇:一种方便切削废料输出的冲压模具