[发明专利]一种基于二分阈值法和投影法多阶段切割文字的方法在审

专利信息
申请号: 201910763993.0 申请日: 2019-08-19
公开(公告)号: CN110532537A 公开(公告)日: 2019-12-03
发明(设计)人: 罗胜 申请(专利权)人: 温州大学
主分类号: G06F17/25 分类号: G06F17/25;G06K9/62;G06T7/136
代理公司: 33247 温州市品创专利商标代理事务所(普通合伙) 代理人: 洪中清<国际申请>=<国际公布>=<进入
地址: 325000 浙江省温州市瓯海*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于二分阈值法和投影法多阶段切割文字的方法,先用二分阈值法检测到部分文字,再用投影法准确定位文字,最后在剩余图像中找加不太明显、容易漏失的文字;先处理大文字,后处理小文字,同时在迭代中处理完一部分文字后,从图像中抹去已经检测到文字,简化后续处理的难度。本发明综合利用了二分阈值法和投影法的优点,能够准确分割大小文字多排混编的情况。
搜索关键词: 投影法 阈值法 后处理 后续处理 剩余图像 准确定位 多阶段 检测 迭代 多排 混编 切割 图像 分割
【主权项】:
1.一种基于二分阈值法和投影法多阶段切割文字的方法,其特征在于:/nS1、采用Ostu方法计算图像的二分阈值,将图像转变为二值图像,白色为前景中的字,黑色为背景;/nS2、将大小、长宽比、占空比在可能范围内的前景区域作为候选的文字,归入文字集T;/nS3、将所有的候选文字按高度降序排列,采用基于密度的聚类算法聚成K类;/nS4、对所有的候选文字按降序进行以下步骤处理:/nS4.1、对当前文字Ti,以其最上位置Up、最下位置Down为当前临时行的行首、行尾,在同类文字Kj中找到质心相近、最上位置和最下位置都在Up-Down内的所有文字归入文字集N,即/n /n式中,Np是文字集N中的任一文字,Kj是第j类文字,UNp、DNp是文字Np的最上位置和最下位置,MNp和MTi是文字Np的质心,Th0、Th1分别是上下位置和质心的容差极限;统计文字集N中的文字最小宽度Wmin;/nS 4.2、在不同类文字中找到处于UNp、DNp内的所有文字M,即/n /n式中,Mq是文字集M中的任一文字,UMq、DMq是文字Mq的最上位置和最下位置;/nS4.3、将图像的Up-Down内的所有像素向竖直方向累加投影成水平投影图;/nS4.4、排除水平投影图左右两端为0的数据后,找到数据中间有字符部分的投影的最大值Smax、最小值Smin;/nS4.5、将文字集N中的所有文字的位置(Left、Right)左右各缩小一个像素(Left+1、Right-1),在水平投影图中将位置(Left+1、Right-1)内的值都置成Smax,同时文字集M中的所有文字所在位置都置成Smin;/nS4.6、在水平投影图中找到排除左右两端为0的数据中有字符部分的位置上的所有最小值;/nS4.7、将每个最小值所在的区域设置为低洼区域,找到低洼区域的左右边界,低洼区域间的区域为峰值区域,判断低洼区域为字间间隙、峰值区域为文字单元的可能性,将可能性超过经验阈值的峰值区域存入文字单元数组、低洼区域存入字间间隙数组,可能性低过经验阈值的峰值区域合并到左右低洼区域;/nS4.8、将每个文字单元的宽度除以步骤S4.1统计出的文字平均宽度,将大于文字平均宽度预设倍数的文字单元以及字间间隙大于最大文字宽度的单元直接作为检测出的文字,将其它单元作为存疑单元,并对连续多个、中间无存疑单元的检出文字作为文字区域,计算每个文字区域的平均字宽度Wc和平均字间隙Wb;/nS4.9、将连续存疑单元作为存疑区域,将L个存疑单元Ui,包括存疑区域前一个检出文字和存疑区域后一个检出文字,共L+2个单元,构成存疑单元集U;用此L+2个单元构造一个(L+2)×(L+2)的矩阵,矩阵中的点(Uh,Ue)(Uh<=Ue,e-h<=4)表示从单元Uh左边开始、在单元Ue右边结束的范围内构成一个字符,点(Uh,Ue)的值Phe表示此范围构成一个字符的成字成本;/nPhe=λ1(Whe-Wc)/(Whe+Wc)+λ2(Whb-Wb)/(Whb+Wb)+λ3(Web-Wb)/(Whe+Wb);/n式中,λ13是加权系数,Whe是单元Uh、单元Ue间的宽度,即从单元Uh左边沿到单元Ue的右边沿的距离Whb是单元Uh左边间隙的宽度Web是单元Ue右边间隙的宽度;/n将矩阵中的成字成本归一化处理,即除以矩阵中成字成本的最大值后,在右上三角矩阵的宽度为4的带状区域中进行动态规划,寻找最优方案;最优方案平均成字成本最小,而且字符宽度的方差、字间隙宽度的方差也最小,如下式:/ncost=λ4mean(Phe)+λ5δWt6δWb/n式中,λ46是加权系数,mean(Phe)是方案中所有点的平均成字成本,δWt方案中所有字符宽度的方差,δWb是方案中所有字间隙宽度的方差;/nS5、检测图像中是否还有其它剩余文字,如还有文字L,按以下步骤处理:/nS5.1、取文字集L的文字Tl,按文字高度判断Tl是否属于已有文字类,如果属于已有文字类,将Tl置入相应文字类,如果不属于任一已有文字类,则文字类数量加1,将Tl置入新的文字类;/nS5.2、按步骤S5.1迭代处理文字集L里的所有文字,直到完成。/n进一步地,所述步骤S4.7中,峰值区域宽度大于Wmin,平均高度比低洼区域的平均高度高Htmin。/n进一步地,所述动态规划的步骤如下:/n(1)生成种子:以第一行的4个点为4个种子,作为4种方案;/n(2)方案生长:每种方案向下生长,从点(Uh,Ue)向下生长时,选择Ue+1行的4个点加入方案;n种方案,每种方案向下生长时有4种可能选择,因此生长一次n种方案变成4n种方案;/n(3)方案裁剪:计算4n种方案的成本,选择成本最小的m种方案作为种子方案;方案中点的数目超过3时开始第一次裁剪,能提高算法的准确性;/n(4)重复步骤(2)、(3),直到每个方案都到达存疑单元集U中的最后一个单元;/n(5)选择成本最小的方案为最优方案,按最优方案给出的策略合并单元组成字符;/n(6)对找到的文字,将图像中相应文字位置都置成背景,然后将找到的文字放入文字集N,再把新文字集N放入文字类Kj中。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910763993.0/,转载请声明来源钻瓜专利网。

同类专利
  • 版式文档注脚的自动识别及转换为流式文档注释的方法-201510293857.1
  • 孙上斌;胡元琪 - 掌阅科技股份有限公司
  • 2015-06-01 - 2019-12-10 - G06F17/25
  • 本发明提供一种版式文档注脚的自动识别方法,包括下列步骤:1)识别出版式文档中的注脚区和正文区;2)根据注脚区内容提取出注脚区注脚序列;3)根据正文区内容提取出正文区注脚序列;4)对步骤2)和步骤3)中得到的注脚区注脚序列和正文区注脚序列进行互相匹配,得到相匹配的注脚区注脚序列和正文区注脚序列。本发明还提供了相应的版式文档注脚的转换为流式文档注释的方法。本发明能够适用于多种形式的版式文件到流式文件的转化,如pdf转为epub等。本发明可以自动的识别版式文件中的注脚,进行注脚的关联,大大解放了人力,增加了处理的速度。本发明的识别方法识别率高、错误率低。
  • 一种基于二分阈值法和投影法多阶段切割文字的方法-201910763993.0
  • 罗胜 - 温州大学
  • 2019-08-19 - 2019-12-03 - G06F17/25
  • 本发明公开了一种基于二分阈值法和投影法多阶段切割文字的方法,先用二分阈值法检测到部分文字,再用投影法准确定位文字,最后在剩余图像中找加不太明显、容易漏失的文字;先处理大文字,后处理小文字,同时在迭代中处理完一部分文字后,从图像中抹去已经检测到文字,简化后续处理的难度。本发明综合利用了二分阈值法和投影法的优点,能够准确分割大小文字多排混编的情况。
  • 一种演示文稿生成方法、装置及设备-201810458002.3
  • 车星;罗永浩 - 成都野望数码科技有限公司
  • 2018-05-14 - 2019-11-22 - G06F17/25
  • 本申请公开一种演示文稿生成方法、装置及设备,该方法包括:接收用户选定的至少一个素材包;然后,确定该素材包中存储的素材的特征,并将该特征与预先存储的排版模板的排版规则进行匹配;最后,利用匹配成功的排版规则对应的排版模板,对素材包中存储的素材进行排版,生成素材包对应的演示文稿。可见,本申请实施例通过将用户选定的素材包中存储的素材的特征与预先存储的排版模板的排版规则进行匹配,并利用匹配成功的排版规则对应的排版模板对素材包中存储的素材进行排版,进而可以自动生成素材包对应的演示文稿,从而实现了更智能、自动化水平更高的演示文稿的生成方式,省时省力,既提升了用户体验,也提升了演示文稿的生成效率。
  • 一种基于机器学习降低印前版面处理错误率的方法-201910675819.0
  • 苏育挺;王明兴;井佩光 - 天津大学
  • 2019-07-25 - 2019-11-15 - G06F17/25
  • 本发明公开了一种基于机器学习降低印前版面处理错误率的方法,包括:提取印前版面处理前以及处理后的矢量路径数、版面尺寸、版面图层层数、版面的色彩空间;将矢量路径数、尺寸、组成图层数、色彩空间组成特征矩阵;将所有版面的特征矩阵构成的特征集合按比例划分为训练集和测试集,选取校验模型的核函数;设置定时任务,定期完成上述两个步骤,获得新的校验模型,比较新的校验模型与旧校验模型分类正确率,选取检错率更高的模型导入生产分类中,对处理过的印前版面结果进行矫正。本发明解决了目前印前版面处理错误无法及时发现,版面校验过度依赖人工检测,传统图像对比耗费时间长,非图像参数错误无法校验等问题。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top