[发明专利]一种文本水印图像的预处理方法和装置有效
申请号: | 202210305987.2 | 申请日: | 2022-03-25 |
公开(公告)号: | CN115063279B | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 李公宝;丛升日 | 申请(专利权)人: | 北京国隐科技有限公司 |
主分类号: | G06T1/00 | 分类号: | G06T1/00;G06V30/146 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100085 北京市海淀区上地信息路1号*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 水印 图像 预处理 方法 装置 | ||
1.一种文本水印图像的预处理方法,其特征在于,包括以下步骤:
提取文本水印图像中所有的文本行;
根据文本行之间的相对位置关系定位待矫正的文本图像区域,并通过直线拟合方式获得文本图像区域的左右边界线,进而定位出文本图像区域的最小外接四边形;
利用文本图像区域的最小外接四边形,采用四点透视变换方法进行文本水印图像的自动矫正;
所述通过直线拟合方式获得文本图像区域的左右边界线,其中获得左边界线的步骤包括:
将每个文本段落的段首行过滤掉;
设集合S中的元素为S1,S2,...,Sk,通过S中保存的文本行来判断文档图像的偏移方向,即向左、向右或者没有偏移,判断过程如下:
Step1:若集合S中所有文本行的起始点横坐标之差的绝对值小于阈值T,则判定文本图像区域的左边界没有偏转,文本图像不用矫正,否则进入Step2;
Step2:设当前文本行的下标为Si,对于下一个文本行Si+1,若满足以下条件,则判断文本行是向右偏移:
其中,TL是预先设定的行偏转阈值,将Si和Si+1保存在集合Q中;若已经判断为向右偏移,而满足以下条件:
则把Si+1加入至集合Q中;若文本行Si+1发生如下情况:
说明本行的位置关系发生异常,Si+1不能保存至集合Q中,需要进一步考察下一文本行Si+2;
若满足|Si+2-Si|=2,且文本行Si与Si+2同样满足或则Si+2保存至集合Q中,继续进行后续搜索;否则,判断过程结束;
文本行向左偏移的判断方式如下:
针对当前的文本行Si,若下一个文本行Si+1满足以下条件,则判断文本行是向左偏移:
将Si和Si+1保存在集合Q中;若已经判断文本行为向左偏移,而同时满足(6)式,则把Si+1加入至集合Q中;若文本行Si+1发生如下情况:
则需要进一步考察文本行Si+2;
若满足|Si+2-Si|=2,且文本行Si与Si+2满足或则Si+2保存至集合Q中,继续进行后续搜索;否则,判断过程结束;
Step3:当文本行发生向左或者向右偏移情况时,则集合Q中的元素为Q1,Q2,...,Qt,对应的文本行分别为获取这t个文本行的左边界线的点集合P,并利用最小二乘法进行直线拟合后,即可得到文本图像区域的左边界线斜率:
则相应的偏移量是:
其中,(xi,yi)为点集P中的一点Pi的坐标,N为集合P中包含点的数目。
2.根据权利要求1所述的方法,其特征在于,所述提取文本水印图像中所有的文本行,包括:
先利用图像形态学变换的方式获取原始图像的梯度子图,并在梯度子图中提取所有文本框,然后将位于同一行中的所有文本框合并得到完整的文本行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国隐科技有限公司,未经北京国隐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210305987.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序