[发明专利]文本行的识别方法及装置、计算设备有效
申请号: | 201610997994.8 | 申请日: | 2016-11-11 |
公开(公告)号: | CN106570500B | 公开(公告)日: | 2018-01-23 |
发明(设计)人: | 张文彩 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 北京博思佳知识产权代理有限公司11415 | 代理人: | 陈蕾 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种文本行的识别方法及装置、计算设备,方法包括基于文字区域的区域特征信息,确定已识别到的文字区域各自所在的文本块,得到至少一个第一文本块;对每一个第一文本块中的全部文字区域在图片中的中心位置坐标进行直线拟合,得到每一个第一文本块对应的第一拟合直线;基于每一个第一文本块中的每一个中心位置坐标到第一拟合直线的距离,确定每一个第一文本块中的全部中心位置坐标到第一拟合直线的第一平均距离;当基于第一平均距离确定至少一个第一文本块中存在需要被划分的第一文本块时,将需要被划分的第一文本块确定为第二文本块,并将其划分成至少两个文本块。本申请可以准确识别场景文字的文本行,提高文本行识别的鲁棒性。 | ||
搜索关键词: | 文本 识别 方法 装置 计算 设备 | ||
【主权项】:
一种文本行的识别方法,其特征在于,所述方法包括:基于图片中已识别到的文字区域的区域特征信息,确定所述已识别到的文字区域各自所在的文本块,得到至少一个第一文本块;对每一个所述第一文本块中的全部文字区域在所述图片中的中心位置坐标进行直线拟合,得到每一个所述第一文本块对应的第一拟合直线;基于每一个所述第一文本块中的每一个所述中心位置坐标到所述第一拟合直线的距离,确定每一个所述第一文本块中的全部中心位置坐标到所述第一拟合直线的第一平均距离;当基于所述第一平均距离确定所述至少一个第一文本块中存在需要被划分的第一文本块时,将所述需要被划分的第一文本块确定为第二文本块,并将第二文本块划分成至少两个子文本块,基于所述至少一个第一文本块中未被划分的第一文本块以及所述至少两个子文本块得到文本行识别结果;所述将所述第二文本块划分成至少两个子文本块,包括:确定所述第二文本块中的全部文字区域各自对应的中心位置坐标与所述第二文本块对应的拟合直线之间的第一相对位置;基于所述第一相对位置将所述第二文本块划分为第一子文本块和第二子文本块,所述第一子文本块的中心位置坐标位于所述第二文本块对应的拟合直线的一侧,所述第二子文本块的中心位置坐标位于所述第二文本块对应的拟合直线的另一侧;基于所述第一子文本块和所述第二子文本块各自包含的文字区域的中心位置坐标到所述第一子文本块和所述第二子文本块各自拟合直线的平均距离,将所述第二文本块划分为至少两个子文本块;所述基于所述第一子文本块和所述第二子文本块各自包含的文字区域的中心位置坐标到所述第一子文本块和所述第二子文本块各自拟合直线的平均距离,将所述第二文本块划分为至少两个子文本块,包括:根据所述第一子文本块中包含的文字区域的中心位置坐标进行直线拟合,得到所述第一子文本块对应的拟合直线;根据所述第二子文本块中包含的文字区域的中心位置坐标进行直线拟合,得到所述第二子文本块对应的拟合直线;基于所述第一子文本块包含的每一个文字区域的中心位置坐标到所述第一子文本块对应的拟合直线的距离,确定所述第一子文本块包含的全部中心位置坐标到所述第一子文本块对应的拟合直线的第二平均距离;基于所述第二子文本块包含的每一个文字区域的中心位置坐标到所述第二子文本块对应的拟合直线的距离,确定所述第二子文本块包含的全部中心位置坐标到所述第二子文本块对应的拟合直线的第三平均距离;基于所述第二平均距离和所述第三平均距离分别与预设阈值之间的关系,将所述第二文本块划分为至少两个子文本块。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610997994.8/,转载请声明来源钻瓜专利网。
- 上一篇:弹性测量检测方法及系统
- 下一篇:可重复使用的递送装置