[发明专利]一种文字检测方法及装置有效
申请号: | 201611124294.4 | 申请日: | 2016-12-08 |
公开(公告)号: | CN108171104B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 文亚飞 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V10/26 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种文字检测方法及装置,其中方法包括:获取待检测图像的边缘信息;根据所述待检测图像的边缘信息,利用预设的候选文字像素点确定规则确定所述待检测图像中的候选文字像素点;对所述候选文字像素点进行投影切割,根据投影切割结果确定所述待检测图像中的文字区域。通过本发明实施例可以提高文字检测的准确率和速度。 | ||
搜索关键词: | 一种 文字 检测 方法 装置 | ||
获取待检测图像的边缘信息;
根据所述待检测图像的边缘信息,利用预设的候选文字像素点确定规则确定所述待检测图像中的候选文字像素点;
对所述候选文字像素点进行投影切割,根据投影切割结果确定所述待检测图像中的文字区域。
2.根据权利要求1所述的方法,其特征在于,所述对所述候选文字像素点进行投影切割,根据投影切割结果确定所述待检测图像中的文字区域之后,所述方法还包括:根据所述文字区域的位置信息,对所述文字区域作行归并处理;
将行归并后的所述文字区域输入预先训练好的文字检测模型,以滤除所述文字区域中的非文字区域。
3.根据权利要求1或2所述的方法,其特征在于,所述获取待检测图像的边缘信息之前,所述方法还包括:统计待检测图像的灰度直方图中像素值的分布情况;
根据所述分布情况,确定所述待检测图像的图像类型;
其中,所述获取待检测图像的边缘信息,包括:
若所述待检测图像为简单图文,则利用第一边缘检测阈值获取所述待检测图像的边缘信息;
若所述待检测图像为复杂图文,则利用第二边缘检测阈值获取所述待检测图像的边缘信息;
其中,所述第一边缘检测阈值小于所述第二边缘检测阈值。
4.根据权利要求1~3中任一项所述的方法,其特征在于,所述根据所述待检测图像的边缘信息,利用预设的候选文字像素点确定规则确定所述待检测图像中的候选文字像素点,包括:根据所述待检测图像的边缘信息,确定所述待检测图像的边缘像素点;
将所述待检测图像的边缘像素点中的目标边缘像素点确定为候选文字像素点;
其中,以所述目标边缘像素点为中心的左右宽度分别为w个像素和上下高度分别为h个像素的图像区域内同时存在其它边缘像素点,w、h均为正整数。
5.根据权利要求1~3中任一项所述的方法,其特征在于,所述对所述候选文字像素点进行投影切割,根据投影切割结果确定所述待检测图像中的文字区域,包括:利用第一切割阈值对所述候选文字像素点进行横向投影切割,得到初始候选文字区域;
利用第二切割阈值和/或第三切割阈值对所述初始候选文字区域中的候选文字像素点进行纵向投影切割;
利用第四切割阈值和/或第五切割阈值对纵向投影切割后的所述初始候选文字区域中的候选文字像素点进行横向投影切割,得到目标候选文字区域;
利用预设的非文字区域滤除规则滤除所述目标候选文字区域中的非文字区域,将所述目标候选文字区域中的剩余区域作为所述待检测图像中的文字区域。
6.根据权利要求5所述的方法,其特征在于,所述利用第一切割阈值对所述候选文字像素点进行横向投影切割,得到初始候选文字区域,包括:对所述候选文字像素点进行横向投影切割,将投影点个数大于或等于第一切割阈值的行确定为有效行;
将所述有效行合并得到初始候选文字区域。
7.根据权利要求5或6所述的方法,其特征在于,所述利用第四切割阈值和/或第五切割阈值对纵向投影切割后的所述初始候选文字区域中的候选文字像素点进行横向投影切割,得到目标候选文字区域之前,所述方法还包括:利用所述初始候选文字区域中的候选文字像素点的几何位置约束对所述初始候选文字区域中的候选文字像素点进行纵向投影切割。
8.根据权利要求7所述的方法,其特征在于,所述几何位置约束包括:所述初始候选文字区域中两个连续的候选文字像素点之间的最大距离、所述初始候选文字区域中位置最高的候选文字像素点与位置最低的候选文字像素点之间的最大距离、所述初始候选文字区域中位置最高的候选文字像素点的位置和位置最低的候选文字像素点的位置中的一种或多种。
9.一种文字检测装置,其特征在于,包括:获取模块,用于获取待检测图像的边缘信息;
确定模块,用于根据所述待检测图像的边缘信息,利用预设的候选文字像素点确定规则确定所述待检测图像中的候选文字像素点;
投影切割模块,用于对所述候选文字像素点进行投影切割;
所述确定模块,还用于根据投影切割结果确定所述待检测图像中的文字区域。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:归并模块,用于根据所述文字区域的位置信息,对所述文字区域作行归并处理;
过滤模块,用于将行归并后的所述文字区域输入预先训练好的文字检测模型,以滤除所述文字区域中的非文字区域。
11.根据权利要求9或10所述的装置,其特征在于,所述装置还包括:统计模块,用于统计待检测图像的灰度直方图中像素值的分布情况;
其中,所述确定模块,还用于根据所述分布情况,确定所述待检测图像的图像类型;
其中,所述获取模块,具体用于:
若所述待检测图像为简单图文,则利用第一边缘检测阈值获取所述待检测图像的边缘信息;
若所述待检测图像为复杂图文,则利用第二边缘检测阈值获取所述待检测图像的边缘信息;
其中,所述第一边缘检测阈值小于所述第二边缘检测阈值。
12.根据权利要求9~11中任一项所述的装置,其特征在于,所述确定模块,具体用于:根据所述待检测图像的边缘信息,确定所述待检测图像的边缘像素点;
将所述待检测图像的边缘像素点中的目标边缘像素点确定为候选文字像素点;
其中,以所述目标边缘像素点为中心的左右宽度分别为w个像素和上下高度分别为h个像素的图像区域内同时存在其它边缘像素点,w、h均为正整数。
13.根据权利要求9~11中任一项所述的装置,其特征在于,所述投影切割模块,具体用于:利用第一切割阈值对所述候选文字像素点进行横向投影切割,得到初始候选文字区域;
利用第二切割阈值和/或第三切割阈值对所述初始候选文字区域中的候选文字像素点进行纵向投影切割;
利用第四切割阈值和/或第五切割阈值对纵向投影切割后的所述初始候选文字区域中的候选文字像素点进行横向投影切割,得到目标候选文字区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611124294.4/,转载请声明来源钻瓜专利网。
- 上一篇:目标检测方法及装置
- 下一篇:一种景区游客实名管理系统