[发明专利]文档字号的识别方法、装置、计算机设备和存储介质在审
| 申请号: | 202210416911.7 | 申请日: | 2022-04-20 |
| 公开(公告)号: | CN115131803A | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 曹润东 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/18;G06V30/186;G06V10/80;G06V10/82;G06V10/764;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 杨欢 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文档 字号 识别 方法 装置 计算机 设备 存储 介质 | ||
1.一种文档字号的识别方法,其特征在于,所述方法包括:
获取待处理的文档图片,检测所述文档图片中各文本行的初始行高度;
识别所述文档图片的文档版面信息,并根据所述文档版面信息确定至少一个待处理的文本块,每个待处理的文本块中包括有至少一个相连续的文本行;
对于任一待处理的文本块,根据相应待处理的文本块所包括的文本行的初始行高度,确定行高度统计信息,并基于所述行高度统计信息确定与相应待处理的文本块对应的目标行高度;
基于预先设置的字号映射规则、以及各待处理的文本块分别对应的目标行高度,得到所述文档图片中各文本块分别对应的目标字号。
2.根据权利要求1所述的方法,其特征在于,所述检测所述文档图片中各文本行的初始行高度,包括:
对所述文档图片进行特征提取,得到多张不同尺度的特征图;
对所述多张不同尺度的特征图进行特征融合,得到融合特征图;
基于所述融合特征图进行文本行检测处理,得到包括有包围文本行的目标检测框,并将所述目标检测框的高度作为所述文本行的初始行高度。
3.根据权利要求1所述的方法,其特征在于,所述识别所述文档图片的文档版面信息,并根据所述文档版面信息确定至少一个待处理的文本块,包括:
基于所述文档图片进行文档版面识别处理,得到所述文档图片中包括的多个文本块,以及每个文本块各自对应的版块类别;
获取目标版块类别,所述目标版块类别至少包括标题版块类别和段落版块类别中的一种;
将与所述目标版块类别对应的文本块,作为待处理的文本块。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述文档图片的文档版面信息,建立以待处理的文本块为索引的数据存储结构,所述数据存储结构中包括有多个分组,每个分组对应一个待处理的文本块;
将属于同一待处理的文本块的文本行,均存储至所述数据存储结构中相应待处理的文本块对应的分组中;各个分组用于并行对各自所存储的文本行进行行高度的调整,得到相应文本块所对应的目标行高度。
5.根据权利要求1所述的方法,其特征在于,所述文档版面信息包括所述文档图片中包括的多个文本块,以及每个文本块各自对应的版块类别,所述版块类别包括页边版块类别;所述方法还包括:
将对应于页边版块类别的预设文本字号,作为所述页边版块类别所对应的文本块对应的文本字号。
6.根据权利要求1所述的方法,其特征在于,所述根据相应待处理的文本块所包括的文本行的初始行高度,确定行高度统计信息,并基于所述行高度统计信息确定与相应待处理的文本块对应的目标行高度,包括:
根据相应待处理的文本块所包括的文本行的初始行高度,计算相应待处理的文本块中文本行的行高度均值;
基于相应待处理的文本块中文本行的行高度均值,确定相应待处理的文本块对应的目标行高度。
7.根据权利要求6所述的方法,其特征在于,所述基于相应待处理的文本块中文本行的行高度均值,确定相应待处理的文本块对应的目标行高度,包括:
根据相应待处理的文本块所包括的文本行的初始行高度,确定相应待处理的文本块所对应的高度变化极值;
基于各个待处理的文本块对应的行高度均值确定参照行高度;
确定所述参照行高度与相应待处理的文本块的行高度均值的差异,根据所述差异与所述高度变化极值,确定相应待处理的文本块的目标行高度。
8.根据权利要求7所述的方法,其特征在于,所述根据所述差异与所述高度变化极值,确定相应待处理的文本块的目标行高度,包括:
在所述差异小于所述高度变化极值的情况下,将所述参照行高度作为相应待处理的文本块对应的目标行高度;
在所述差异大于或等于所述高度变化极值的情况下,将相应待处理的文本块的行高度均值作为相应文本块对应的目标行高度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210416911.7/1.html,转载请声明来源钻瓜专利网。





