[发明专利]一种文字检测方法及装置有效
申请号: | 201611124294.4 | 申请日: | 2016-12-08 |
公开(公告)号: | CN108171104B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 文亚飞 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V10/26 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 检测 方法 装置 | ||
本发明实施例提供了一种文字检测方法及装置,其中方法包括:获取待检测图像的边缘信息;根据所述待检测图像的边缘信息,利用预设的候选文字像素点确定规则确定所述待检测图像中的候选文字像素点;对所述候选文字像素点进行投影切割,根据投影切割结果确定所述待检测图像中的文字区域。通过本发明实施例可以提高文字检测的准确率和速度。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文字检测方法及装置。
背景技术
随着互联网技术的快速发展,互联网承载的图片内容呈爆炸性增长趋势,对图片中的文字进行检测具有十分重要的研究和应用价值,例如应用于图片分类、图片检索、文字识别等。
目前常用的是基于笔画宽度变换(Stroke Width Transform,SWT)的文字检测方案,主要包括:对输入图像以固定阈值提取canny边缘和梯度方向,进行笔画宽度变换,对边缘图像进行连通域分析,增加笔画宽度的约束,通过先验知识比如连通域笔画的方差,均值,高,宽,高宽比等把明显不满足要求的非文字连通域滤除掉,通过上述步骤得到的连通域为单个的候选字符,再将笔画宽度、颜色、距离相近的候选字合并成整行。然而,上述方案在对低对比度、背景纹理丰富的复杂图像进行文字检测时容易存在漏检以及误检的情况,并且检测速度慢,不适合实时或者大数据处理的场景。可见,如何提供一种准确率高并且速度快的文字检测方案已成为亟待解决的问题。
发明内容
本发明实施例提供了一种文字检测方法及装置,可以提高文字检测的准确率和速度。
本发明实施例第一方面提供了一种文字检测方法,包括:
获取待检测图像的边缘信息。
根据所述待检测图像的边缘信息,利用预设的候选文字像素点确定规则确定所述待检测图像中的候选文字像素点。
对所述候选文字像素点进行投影切割,根据投影切割结果确定所述待检测图像中的文字区域。
本发明实施例第二方面提供了一种文字检测装置,包括:
获取模块,用于获取待检测图像的边缘信息。
确定模块,用于根据所述待检测图像的边缘信息,利用预设的候选文字像素点确定规则确定所述待检测图像中的候选文字像素点。
投影切割模块,用于对所述候选文字像素点进行投影切割。
所述确定模块,还用于根据投影切割结果确定所述待检测图像中的文字区域。
通过本发明实施例可以获取待检测图像的边缘信息,根据该待检测图像的边缘信息,利用预设的候选文字像素点确定规则确定该待检测图像中的候选文字像素点,并对该候选文字像素点进行投影切割,再根据投影切割结果即可确定该待检测图像中的文字区域,从而可以提高文字检测的准确率,还可以提高文字检测的速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种文字检测方法的第一实施例流程示意图;
图2a是本发明实施例提供的一种灰度直方图;
图2b是本发明实施例提供的另一种灰度直方图;
图2c是本发明实施例提供的又一种灰度直方图;
图2d是本发明实施例提供的又一种灰度直方图;
图2e是本发明实施例提供的一种文字检测的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611124294.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:目标检测方法及装置
- 下一篇:一种景区游客实名管理系统