[发明专利]多模板证书快速审证方法、系统、介质及装置在审

专利信息
申请号: 202110594815.7 申请日: 2021-05-28
公开(公告)号: CN113343968A 公开(公告)日: 2021-09-03
发明(设计)人: 胡逸凡;杨铖;武宽;马楷 申请(专利权)人: 广州云从人工智能技术有限公司
主分类号: G06K9/20 分类号: G06K9/20;G06K9/32;G06K9/62;G06N3/08
代理公司: 北京瀚仁知识产权代理事务所(普通合伙) 11482 代理人: 刘江帅;宋宝库
地址: 511458 广东省广州市南沙区丰泽*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 模板 证书 快速 方法 系统 介质 装置
【说明书】:

发明属于证书识别技术领域,尤其涉及一种多模板证书快速审证方法、系统、介质及装置。本发明旨在解决现有海关检疫审核时间长、准确度低的问题。本发明的方法包括:接收待审核证书图片;匹配证书图片对应的模板;基于模板中的预设ROI区域的坐标,框选证书图片中的实际ROI区域;通过OCR模型对框选的实际ROI区域的图片进行处理,获得实际ROI区域内的字段结果;对字段结果进行抽取,获得最终的证书信息;根据识别出的证书信息判断待审核证书的真伪判别。本发明基于文本框匹配模板,基于模板预设ROI得到图片实际ROI,再对实际ROI区域进行识别,避免了其它杂项的干扰,识别准确增加。

技术领域

本发明涉及证书识别技术领域,尤其涉及一种多模板证书快速审证方法、系统、介质及装置。

背景技术

不同于身份证、银行卡识别校验等文本量小的任务,从样式多样、布局复杂、页数不一的多模板的各类证书文件中,人工查找关键字段并与业务数据比对是非常耗时耗力的任务。下面以某省份海关的检验检疫证书审核为例进行说明,当然,多模板证书的应用场景不仅限于此,例如由于毕业证书也是每个学校不同,本发明还可以应用于企业或者特殊机关对毕业证书的识别等场景。在海关检疫证书审证过程中,官员需要人工对企业通过“线上海关”上传的证书扫描件与各国证书模板、兽医官签字信息、签证官信进行比对校验。关员审核1份进口肉类检验检疫证书,需要切换4个业务系统和网站,核对近20个要素,每份证书审核耗时约10-30分钟,现场关员工作压力大,人工核对的准确率却难以得到完全保证。因此,借助基于人工智能技术的OCR(Optical Character Recognition,光学字符识别)方法,实现对证书扫描件的智能文字识别和自动字段提取有重大意义。

根据识别场景,可大致将OCR分为识别特定场景的专用OCR和识别多种场景的通用OCR。通用OCR可以用于多数场景,但由于通用图片的场景不固定,文字布局多样,因此需要直接识别所有文字,准确度较低且计算量较大。常见的身份证识别和车牌识别就是专用OCR的典型案例,往往只检测并识别部分关键字段。但由于要检测这些字段,需要事先采集大量实际生产环境样本图片并进行人工标注,才能训练深度神经网络模型进行关键字段的检测识别,而且,每增加一种不同样式的待识别证件都需要重新训练。

检验检疫场景下,需要对不同语种、国家、证书类型,包含至少四十多种不同样式的证书,实现OCR识别和字段提取。若对每类证书单独训练专用OCR模型,需要采集海量证书文件并人工标注,工作量过于庞大且扩展不灵活,并且由于客观限制,从海关获取如此多的数据涉及到的泄密可能性太高,也是不能实现的;但如果直接使用通用OCR,则难以从全文信息中精准提取关键字段,准确度也不足。

相应地,本领域需要一种新的多模板证书快速审证方法、系统、介质及装置来解决现有海关检疫审核时间长、准确度低的问题。

发明内容

为了解决现有技术中的上述问题,即为了解决现有海关检疫审核时间长、准确度低的问题,本发明提供了一种多模板证书快速审证方法,包括:

S01、接收待审核的证书图片;

S03、匹配所述证书图片对应的模板;

S04、基于所述模板中的预设ROI区域的坐标,框选所述证书图片中的实际ROI区域;

S05、通过已训练的OCR模型对框选的实际ROI区域的图片进行处理,获得所述实际ROI区域内的字段结果;

S06、对所述字段结果进行抽取,获得最终的证书信息;

S07、根据识别出的证书信息查询系统内录入的证书信息并据此进行待审核证书的真伪判别。

在上述方法的优选技术方案中,步骤S01之后,所述方法还包括:

S08、将所述证书图片的格式转换成统一预设格式;并且/或者,

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州云从人工智能技术有限公司,未经广州云从人工智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110594815.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top