[发明专利]一种基于嵌入空间像素聚类的文本区域检测方法有效

专利信息
申请号: 202110847077.2 申请日: 2021-07-27
公开(公告)号: CN113298054B 公开(公告)日: 2021-10-08
发明(设计)人: 李岩;李斌阳;范晓焓;舒言 申请(专利权)人: 国际关系学院
主分类号: G06K9/00 分类号: G06K9/00;G06K9/20;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京天达知识产权代理事务所(普通合伙) 11386 代理人: 许志宏
地址: 100091*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 嵌入 空间 像素 文本 区域 检测 方法
【说明书】:

发明涉及一种基于嵌入空间像素聚类的文本区域检测方法,解决了现有技术中对不规则文本区域的检测结果不准确的问题。该方法包括获得待识别文本图像的形状空间的第一原尺寸文本区域预测图、第一中心线区域预测图、第一核区域预测图、第一高度预测图和第一角度预测图,待识别文本图像包括至少一个第一不规则文本区域;基于第一原尺寸文本区域预测图、第一中心线区域预测图以及第一核区域预测图,得到第一嵌入空间的第一像素聚类预测图,对第一中心线区域预测图进行优化,得到形状空间的优化第一中心线区域预测图,结合第一高度预测图以及第一角度预测图,得到待识别文本图像中文本区域位置。实现了对不规则文本区域的准确检测,提高了检测准确率。

技术领域

本发明涉及文本检测技术领域,尤其涉及一种基于嵌入空间像素聚类的文本区域检测方法。

背景技术

近年来,随着文本检测技术的不断发展,场景文本检测的性能也在提升,文本区域检测的出发点在于把有意义的文本实例尽可能地合并,按照不同检测方法可分为基于组件、基于分割和基于回归的文本区域检测,由于文本检测的结果是有意义的文本实例,有利于识别端提取更加丰富的文本信息,并且其广泛存在于中英文地点和标识中,有很大的应用前景。

但由于场景文字的多样性,任意形状文本区域检测也面临更大的挑战。现有的文本区域检测技术对于印刷版面的文本区域检测准确率较高,但在场景文本检测中仍存在如下缺陷:(1)一种是基于目标检测的方法,使用四边形来框出文本区,实现比较简单,但对于倾斜或者弯曲文本检测不准确;另一种是基于图像分割的方法,像素级地检测文本,对弯曲文本的检测更加准确,但置信度难以确定,对十分接近的两行文本可能检测为一行;而以往的文本检测大多是针对四边形文本实例,直接用四边形框出文本区域,在检测曲线文本时存在缺陷,效果并不理想。(2)使用传统的分割方式,在文字区域中间被障碍物隔开的情况下,不能很好地确定一个文本行,当间隔超出一定距离时,属于同一个文本行的字符会被划分到两个文本区域。

基于上述分析,急需寻求一种文本区域检测方法,用于提高不规则文本区域检测的准确性。

发明内容

鉴于上述的分析,本发明实施例旨在提供一种基于嵌入空间像素聚类的文本区域检测方法,用以解决现有针对不规则文本区域的检测结果不准确的问题。

一方面,本发明实施例提供了基于嵌入空间像素聚类的文本区域检测方法,该方法包括:

获得待识别文本图像的形状空间的第一原尺寸文本区域预测图、第一中心线区域预测图、第一核区域预测图、第一高度预测图和第一角度预测图,所述待识别文本图像包括至少一个第一不规则文本区域;

基于所述第一原尺寸文本区域预测图、第一中心线区域预测图以及第一核区域预测图,得到第一嵌入空间的第一像素聚类预测图;

基于所述第一像素聚类预测图对所述第一中心线区域预测图进行优化,得到形状空间的优化第一中心线区域预测图;

基于所述优化第一中心线区域预测图,结合所述第一高度预测图以及所述第一角度预测图,得到待识别文本图像中文本区域位置。

进一步,所述第一像素聚类预测图包括第一聚类中心以及第一聚类像素,所述得到第一嵌入空间的第一像素聚类预测图,包括:

基于所述第一原尺寸文本区域预测图,对所述第一中心线区域预测图以及第一核区域预测图进行去噪,得到去噪后的第一中心线区域预测图以及去噪后的第一核区域预测图;

将所述去噪后的第一核区域预测图中的文本核区域在所述第一嵌入空间中形成初始聚类中心;

判断任意两个初始聚类中心之间的嵌入距离,结合初始聚类中心以及第一预设距离,得到第一聚类中心;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际关系学院,未经国际关系学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110847077.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top