[发明专利]一种自动审核证明材料的方法和装置在审
申请号: | 202210697537.2 | 申请日: | 2022-06-20 |
公开(公告)号: | CN115018464A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 陈健;周云松;叶俊;齐宁;王培才;韩宇 | 申请(专利权)人: | 江苏省联合征信有限公司 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06V10/74;G06V10/75;G06V10/764;G06V10/774 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶涓涓 |
地址: | 210000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 审核 证明 材料 方法 装置 | ||
本发明提供了一种自动审核证明材料的方法和装置,能够自动分析判断用户上传的证明材料是否规范,极大提升整体审核效率,准确度高。本发明利用模板配置功能,配置不同证明材料的模板以及相似度阈值;根据相似度算法,根据用户上传的不同模板,计算用户上传证明材料与模板的相似度,并能预先过滤不符合要求的图片数据。本发明通过采集不同的模板训练数据利用工具标注不同模块的证明材料训练数据,然后训练改进adaboost算法,得出图片审核算法,并且利用人工复核模块得出的数据集再次作为训练样本,递归训练审核算法,提升算法精度。
技术领域
本发明属于数据处理技术领域,涉及计算机软件、数据库和数据建模,具体涉及一种自动审核证明材料的方法和装置。
背景技术
随着软件技术的大规模应用,目前大规模数据的上传、录入、存储都离不开软件系统的支持。对于任何一个需要用户上传证明材料的系统来说,往往都需要通过后台人工审核用户上传的证明材料是否符合系统的要求,但随着系统业务量的逐渐增加,需要耗费大量的人力去审核证明材料,而且可能由于工作强度过大导致审核错误,这就会造成系统整体效率的日益低下,甚至可能导致社会关键环节的运转迟滞。
往往用户上传的证明材料都会包含政府部门加盖的印章信息比如购房证明、学历证书、学位证书、户口本、驾照、社保缴费信息、劳动合同、出生证明、体检报告等等证明材料,并且大多数系统要求用户将证明材料拍照后上传到系统,但目前尚缺乏准确有效的材料自动审核方案。基于证明材料的特有属性,本发明提出一种自动审核证明材料的方法和装置。
发明内容
为解决上述问题,本发明利用数据库和数据建模技术,构建了一种自动审核证明材料的方法和装置。
为达到上述目的,本发明的技术方案如下:
一种自动审核证明材料的方法,包括如下步骤:
步骤1:配置上传系统需要审核的证明材料模板,具体包括:
步骤1.1,收集当前业务系统需要审核的证明材料类别;
步骤1.2,针对步骤1.1收集的证明材料,挑选出符合条件的证明材料,并以此制作证明材料模板;
步骤1.3,标记步骤1.2制作的证明材料模板是否需要加盖印章以及证明材料类别,并对不同的类型设置不同的编码值;
步骤2:存储用户上传的证明材料和证明材料类型对应的码值;
步骤3:计算用户上传证明材料与步骤1配置的模板材料相似度;包括:
步骤3.1,通过步骤2上传的证明材料类型,根据用户上传的证明材料码值筛选出进行相似度计算的模板;
步骤3.2,通过相似度匹配算法计算出当前用户证明材料与模板的相似度,包括如下过程:首先裁剪用户上传材料中的图片,令其与模板中图片的图片大小一致;并将裁剪后的图片进行灰度化处理;计算图片的直方图数据,统计相同像素点的概率分布,根据相关性计算公式,计算两个图片直方图的相似度;
步骤4:过滤步骤3中相似度低的证明材料,判断步骤3计算得到的相似度是否超过设定的阈值,没有则直接判定当前证明材料不符合要求,直接返回结果信息;如果等于或超过设定的阈值则进入步骤5;
步骤5:自动审核步骤4过滤的证明材料;通过预先训练的改进adaboost算法识别步骤4中超过阈值的证明材料并提取材料中的印章信息,包括:
步骤5.1,利用互联网以及系统本身采集的证明材料,人工标注改进adaboost算法需要的训练数据;
步骤5.2,利用人工标注的训练数据集,进行改进adaboost训练,并得出训练后的分类器作为图片审核算法;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省联合征信有限公司,未经江苏省联合征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210697537.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理