[发明专利]文本检测方法、装置、存储介质及计算机设备在审

专利信息
申请号: 202111485964.6 申请日: 2021-12-07
公开(公告)号: CN114155535A 公开(公告)日: 2022-03-08
发明(设计)人: 叶俊科 申请(专利权)人: 创优数字科技(广东)有限公司
主分类号: G06V30/148 分类号: G06V30/148;G06F40/295;G06F16/35;G06V10/774;G06V30/19;G06V10/56
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 李秋梅
地址: 516000 广东省广州市海珠区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 检测 方法 装置 存储 介质 计算机 设备
【说明书】:

本申请提供的文本检测方法、装置、存储介质及计算机设备,在对包含文本的待检测图像进行文本检测时,将文本检测范围从整个待检测图像缩小至单个的文本区域,有利于后续文本识别的效率和精度,避免其他非文本区域的影响;接着本申请可以对待识别的文本区域中的文本进行识别,并得到相应的文本识别结果,该文本识别结果中包含待检测图像中所有的文本信息,在此基础上,本申请可以对文本信息中的关键词进行检查,如对文本识别结果中的目标实体进行抽取后,根据目标实体与标准实体之间的比对结果来确定待检测图像中的文本是否编写正确,这样既可以保证待检测图像中的关键词的正确性,还可以减少文本检测的计算量,进一步提高文本检测的效率。

技术领域

本申请涉及文本识别技术领域,尤其涉及一种文本检测方法、装置、存储介质及计算机设备。

背景技术

目前,绝大部分产品在售出时都会附带有对应的实物标签,而实物标签主要是用于标明物品的品名、重量、体积、用途等信息的简要标牌。如产品说明标签、价格标签、主要成分标签、规格标签、材质标签、地址标签、日期标签等。

一般地,在产品上架前,需要对该产品的实物标签中的内容进行检查,如核对实物标签中的价格是否错误、地址是否正确、产品说明中是否有文本错误等。现有的检查方式主要是采用人工进行核对,核对时,将该实物标签与PLM(产品生命周期管理)系统中存储的真实标签进行逐字比对,如果出现错误,则返回给设计师重新进行修改,修改后重新进行人工核对,直到设计正确为止。

但是,由于产品的上新速度较快,而人工核对的速度较慢,无法在短时间内完成大量的检查工作,从而导致检查效率较低,且由于检查量过大,还可能会出现漏检、错检的情况,使得人工检查的准确率较低。

发明内容

本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中产品的上新速度较快,而人工核对的速度较慢,无法在短时间内完成大量的检查工作,从而导致检查效率较低,且由于检查量过大,还可能会出现漏检、错检的情况,使得人工检查的准确率较低的技术缺陷。

本申请提供了一种文本检测方法,所述方法包括:

获取包含文本的待检测图像;

确定所述待检测图像中待识别的文本区域;

对所述待识别的文本区域中的文本进行识别,得到文本识别结果;

抽取所述文本识别结果中的目标实体,并将所述目标实体与标准实体进行比对,根据比对结果确定所述待检测图像中的文本是否编写正确。

可选地,所述确定所述待检测图像中待识别的文本区域,包括:

获取目标文本区域检测模型;

将所述待检测图像输入到所述目标文本区域检测模型中,得到所述目标文本区域检测模型输出的所述待检测图像中待识别的文本区域。

可选地,所述获取目标文本区域检测模型,包括:

获取包含文本的第一样本图像;

按照预设的划分策略,将所述第一样本图像划分为多个子样本图像;

标注每一子样本图像的真实图像中心点、真实图像大小,以及每一子样本图像在所述第一样本图像中的真实图像坐标;

将各个子样本图像依次输入至预设的初始文本区域检测模型中,得到所述初始文本区域检测模型输出的每一子样本图像的预测图像中心点、预测图像大小,以及每一子样本图像在所述第一样本图像中的预测图像坐标;

以每一子样本图像的预测图像中心点、预测图像大小,以及每一子样本图像在所述第一样本图像中的预测图像坐标,趋近于每一子样本图像的真实图像中心点、真实图像大小,以及每一子样本图像在所述第一样本图像中的真实图像坐标为目标,训练所述初始文本区域检测模型;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创优数字科技(广东)有限公司,未经创优数字科技(广东)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111485964.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top