[发明专利]一种文本定位方法和装置在审
申请号: | 202010147332.8 | 申请日: | 2020-03-05 |
公开(公告)号: | CN112749606A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 郑岩 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06K9/46;G06K9/62 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 汪阮磊 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 定位 方法 装置 | ||
1.一种文本定位方法,其特征在于,包括:
获取文本图像;
对所述文本图像进行字符轮廓提取,得到所述文本图像中字符的字符轮廓信息;
根据所述字符轮廓信息,从所述文本图像中确定字符所在的字符区域;
对所述字符区域进行分类,得到所述字符区域的字符类别;
根据所述字符区域的字符类别,对所述字符区域进行区域合并,得到每种字符类别对应的目标字符区域。
2.根据权利要求1所述的方法,其特征在于,所述对所述文本图像进行字符轮廓提取,得到所述文本图像中字符的字符轮廓信息,包括:
对所述文本图像进行灰度处理,得到所述文本图像对应的灰度图像;
对所述灰度图像进行二值化处理,得到处理后文本图像;
对所述处理后文本图像进行字符轮廓提取,得到所述文本图像中字符的字符轮廓信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述字符轮廓信息,从所述文本图像中确定字符所在的字符区域,包括:
根据所述字符轮廓信息,从所述文本图像中确定字符的初始字符区域;
对所述初始字符区域进行修正处理,得到字符所在的字符区域。
4.根据权利要求3所述的方法,其特征在于,所述对所述初始字符区域进行修正处理,得到字符所在的字符区域,包括:
确定所述初始字符区域的区域面积;
根据所述区域面积的大小对所述初始字符区域进行筛选,得到字符的候选字符区域;
对所述候选字符区域进行合并处理,得到字符所在的字符区域。
5.根据权利要求4所述的方法,其特征在于,所述对所述候选字符区域进行合并处理,得到字符所在的字符区域,包括:
从所述候选字符区域中确定存在交集区域的候选字符区域对、以及不存在交集区域的独立候选字符区域;
计算所述交集区域与参考候选字符区域的区域面积比值,其中,所述参考候选字符区域为所述候选字符区域对中区域面积最小的候选字符区域;
基于所述区域面积比值,对所述候选字符区域对进行合并,得到合并后候选字符区域;
根据独立候选字符区域以及合并后候选字符区域,确定字符所在的字符区域。
6.根据权利要求1所述的方法,其特征在于,所述根据所述字符区域的字符类别,对所述字符区域进行区域合并,得到每种字符类别对应的目标字符区域,包括:
对所述字符区域进行排序,得到排序后字符区域;
在排序后字符区域中,对字符类别相同的相邻字符区域进行区域合并,得到每种字符类别对应的目标字符区域。
7.根据权利要求6所述的方法,其特征在于,所述在排序后字符区域中,对字符类别相同的相邻字符区域进行区域合并,得到每种字符类别对应的目标字符区域,包括:
获取排序后字符区域的区域属性;
在排序后字符区域中,根据排序后字符区域的区域属性,对字符类别相同的相邻字符区域进行区域合并,得到每种字符类别对应的目标字符区域。
8.根据权利要求1所述的方法,其特征在于,所述对所述字符区域进行分类,得到所述字符区域的字符类别,包括:
通过预设分类模型对所述字符区域进行分类,得到所述字符区域的字符类别;
所述方法还包括:
获取样本文本图像,以及所述样本文本图像中样本字符区域的样本字符类别;
对所述样本文本图像进行预处理,得到处理后样本文本图像;
通过所述处理后样本文本图像以及所述样本字符区域的样本字符类别,对分类模型进行训练,得到预设分类模型。
9.根据权利要求8所述的方法,其特征在于,所述通过预设分类模型对所述字符区域进行分类,得到所述字符区域的字符类别,包括:
对所述字符区域进行特征提取,得到所述字符区域的区域特征;
基于所述区域特征,预测所述字符区域中每个像素的类别概率;
根据所述字符区域中每个像素的类别概率,确定所述字符区域的字符类别。
10.一种文本定位装置,其特征在于,包括:
获取单元,用于获取文本图像;
提取单元,用于对所述文本图像进行字符轮廓提取,得到所述文本图像中字符的字符轮廓信息;
确定单元,用于根据所述字符轮廓信息,从所述文本图像中确定字符所在的字符区域;
分类单元,用于对所述字符区域进行分类,得到所述字符区域的字符类别;
合并单元,用于根据所述字符区域的字符类别,对所述字符区域进行区域合并,得到每种字符类别对应的目标字符区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010147332.8/1.html,转载请声明来源钻瓜专利网。