[发明专利]一种快速的复杂背景图像中维语文字定位方法有效
申请号: | 201810375055.9 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108573258B | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 谢洪涛;张勇东 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06K9/46 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;郑哲 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 复杂 背景 图像 语文 定位 方法 | ||
本发明公开了一种快速的复杂背景图像中维语文字定位方法,包括:基于检测模版从图像中检测笔划关键点;结合检测到的笔划关键点与洪泛算法提取图像中的文字组件;基于文字组件相似性进行组件聚类,实现文字行的构造;利用HOG+SVM系统构成的行分类器,对文字行进行HOG特征提取,以及文字行与非文字行的二分类。该方法可以提升复杂背景图像中维语文字定位的速度和精度。
技术领域
本发明涉及复杂背景图像中文字定位领域,尤其涉及一种快速的复杂背景图像中维语 文字定位方法。
背景技术
复杂背景图像中维语文字定位技术在图像内容分析、图像内容检索和维文OCR等领 域具有广泛的应用前景。虽然近年来大量的学者投身于复杂背景图像中文字定位研究,但是他们的研究主要针对中文和英文。维文与中英文的差异性使得现有文字定位方法对维文不鲁棒,因此如何提高复杂背景图像中的维语文字定位的速度与精度是本方法的研究关键。此外由于图像中文字位置的灵活性,对候选的搜索过程十分耗时;由于图像中 文字的多样性(如:字体、颜色和大小等)、图像背景的复杂性(如:树枝、栅栏和草 地等)和图像质量的差异性(如:模糊、低分辨率和形变等),使得文字与非文字的准 确分类极具挑战。
现有的文字定位方法大致可以分为两大类:基于滑动窗口分类的方法和基于连接组件 分析的方法。基于滑动窗口分类的方法通过在多尺度图像上滑动窗口来搜索文字候选。 这种搜索方式非常详尽,所以往往能取得较高的召回率,但是其过程十分耗时。同时搜索过程中产生大量的候选,增加了后续候选分类的计算压力。基于连接组件分析的方 法,一般先根据文字的固有特性(笔划、颜色和空间位置等)提取出候选组件,再使用 图连接算法将提取出的文字组件连接成文字区域。这类方法比基于滑动窗口分类的方法 快,但是组件提取和组件分类的过程依然十分耗时。
综合分析上述两种方法可知,在现有“候选产生-候选分类”的文字定位框架中,候选产生的数据量大同时候选分类产生大量额外的时间开销。此外当前没有有效的手工特征以区分文字与非文字候选,而深度学习到的特征框架又太大计算成本高。轻量级快速 准确的复杂背景图像中维语文字定位技术依旧是一个研究难点,具有广泛的应用价值。
发明内容
本发明的目的是提供一种快速的复杂背景图像中维语文字定位方法,可以提升复杂背 景图像中维语文字定位的速度和精度。
本发明的目的是通过以下技术方案实现的:
一种快速的复杂背景图像中维语文字定位方法,包括:
基于检测模版从图像中检测笔划关键点;
结合检测到的笔划关键点与洪泛算法提取图像中的文字组件;
基于文字组件相似性进行组件聚类,实现文字行的构造;
利用HOG+SVM系统构成的行分类器,对文字行进行HOG特征提取,以及文字行与 非文字行的二分类。
由上述本发明提供的技术方案可以看出,执行笔划关键点检测、组件提取、基于相似 性的组件聚类以及文字行分类,可以显著提升复杂背景图像中维语文字定位的速度和精 度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的 附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得 其他附图。
图1为本发明实施例提供的一种快速的复杂背景图像中维语文字定位方法的流程图;
图2为本发明实施例提供的三种笔划关键点的示意图;
图3为本发明实施例提供的检测模版示意图;
图4为本发明实施例提供的笔划端点示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810375055.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于自然语言短语对图像进行自动分割
- 下一篇:无人机飞行方向分析系统及方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序