[发明专利]文本检测方法、装置、存储介质及计算机设备在审
申请号: | 202111485964.6 | 申请日: | 2021-12-07 |
公开(公告)号: | CN114155535A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 叶俊科 | 申请(专利权)人: | 创优数字科技(广东)有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06F40/295;G06F16/35;G06V10/774;G06V30/19;G06V10/56 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李秋梅 |
地址: | 516000 广东省广州市海珠区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 装置 存储 介质 计算机 设备 | ||
1.一种文本检测方法,其特征在于,所述方法包括:
获取包含文本的待检测图像;
确定所述待检测图像中待识别的文本区域;
对所述待识别的文本区域中的文本进行识别,得到文本识别结果;
抽取所述文本识别结果中的目标实体,并将所述目标实体与数据库中的标准实体进行比对,根据比对结果确定所述待检测图像中的文本是否编写正确。
2.根据权利要求1所述的文本检测方法,其特征在于,所述确定所述待检测图像中待识别的文本区域,包括:
获取目标文本区域检测模型;
将所述待检测图像输入到所述目标文本区域检测模型中,得到所述目标文本区域检测模型输出的所述待检测图像中待识别的文本区域。
3.根据权利要求2所述的文本检测方法,其特征在于,所述获取目标文本区域检测模型,包括:
获取包含文本的第一样本图像;
按照预设的划分策略,将所述第一样本图像划分为多个子样本图像;
标注每一子样本图像的真实图像中心点、真实图像大小,以及每一子样本图像在所述第一样本图像中的真实图像坐标;
将各个子样本图像依次输入至预设的初始文本区域检测模型中,得到所述初始文本区域检测模型输出的每一子样本图像的预测图像中心点、预测图像大小,以及每一子样本图像在所述第一样本图像中的预测图像坐标;
以每一子样本图像的预测图像中心点、预测图像大小,以及每一子样本图像在所述第一样本图像中的预测图像坐标,趋近于每一子样本图像的真实图像中心点、真实图像大小,以及每一子样本图像在所述第一样本图像中的真实图像坐标为目标,训练所述初始文本区域检测模型;
当所述初始文本区域检测模型满足预设的第一训练条件时,将训练完成的初始文本区域检测模型作为目标文本区域检测模型。
4.根据权利要求1-3任一项所述的文本检测方法,其特征在于,对所述待识别的文本区域中的文本进行识别,得到文本识别结果,包括:
对所述待识别的文本区域中的文本行进行定位,得到至少一个文本行;
获取目标文本识别模型;
将每个文本行依次输入至所述目标文本识别模型中,得到所述目标文本识别模型输出的文本识别结果。
5.根据权利要求4所述的文本检测方法,其特征在于,所述获取目标文本识别模型,包括:
获取包含文本的第二样本图像,对所述第二样本图像中的文本行进行截取后,得到多个训练图像;
对各个训练图像中的文本分别进行标注后得到第二样本标签,所述第二样本标签为各个训练图像中的文本所对应的字符在字典中映射得到的索引;
将各个训练图像分别输入至预设的初始文本识别模型,得到所述初始文本识别模型输出的与各个训练图像对应的预测标签;
以所述预测标签趋近于所述第二样本标签为目标,训练所述初始文本识别模型;
当所述初始文本识别模型满足预设的第二训练条件时,将训练完成的初始文本识别模型作为目标文本识别模型。
6.根据权利要求5所述的文本检测方法,其特征在于,所述将各个训练图像分别输入至预设的初始文本识别模型之前,还包括:
按照预设的增强策略,对各个训练图像分别进行数据增强。
7.根据权利要求1或2或3或5或6所述的文本检测方法,其特征在于,所述抽取所述文本识别结果中的目标实体,包括:
确定目标NLP模型;
将所述文本识别结果输入至所述目标NLP模型中,得到所述目标NLP模型输出的所述文本识别结果中的目标实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创优数字科技(广东)有限公司,未经创优数字科技(广东)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111485964.6/1.html,转载请声明来源钻瓜专利网。