[发明专利]一种票据审核方法及系统在审
申请号: | 201910577167.7 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110334640A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 王宇;郭近之;赵娟;陆俊龙;彭举 | 申请(专利权)人: | 苏宁云计算有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 许峰 |
地址: | 210042 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据审核 票据 审核 正确率 构建 图片 | ||
2.按照权利要求1所述的方法,其特征在于,所述获取含有票据的图片,对图片中的票据进行识别,构建专项模型,包括:
获取含有票据的图片,对所述图片中的票据进行识别分类,获得票据识别结果,所述图片包括N张票据,N为大于1的整数,所述票据识别结果包括N张单张票据图片;
对所述N张单张票据图片进行文字识别,获得文字识别结果;
将所述文字识别结果封装成专项模型。
3.根据权利要求2所述的方法,其特征在于,所述对所述图片中的票据进行识别分类,具体包括:
将所述图片的大小调整设定值;
在所述调整后的图片上运行单个卷积网络;
由OCR识别技术中的目标检测模型的置信度对获得的图片运行卷积结果进行阈值处理;
利用神经网络做图像语义分割,获得N张单张票据图片。
4.根据权利要求2所述的方法,其特征在于,所述将所述文字识别结果封装成专项模型,具体包括:
根据所述文字识别结果,得到所述单张票据图片上的票据所属的类型;
根据所述票据所属的类型,将文字识别结果封装成所述票据的专项模型,所述专项模型包括至少一个业务字段;
将所述一个或多个业务字段约定为所述专项模型的目标字段。
5.根据权利要求1所述的方法,其特征在于,所述对所述专项模型进行训练,包括:
从图片中采集数据信息,所述数据信息包括业务数据和模型识别数据一致的正确数据信息,以及业务数据和模型识别数据不一致的错误数据信息;
判断所述错误数据信息是否为模型识别错误,若是,则进入下一步;
根据所述错误数据信息,进行模型反义,并自动打标,训练模型。
6.按照权利要求5所述的方法,其特征在于,所述进行模型反义,包括:
将数据信息生成字段信息;
从所述字段信息查找标记为错误的模型数据信息;
根据所述标记为错误的模型数据信息,还原成带坐标的通用文字识别结果。
7.按照权利要求5所述的方法,其特征在于,所述自动打标,训练模型,包括:
根据所述带坐标的通用文字识别结果,在图片中对应的坐标处,标记出正确数据信息和错误数据信息;
利用所述正确数据信息调整所述错误数据信息所属模型。
8.按照权利要求1所述的方法,其特征在于,还包括构建规则引擎,具体包括:
根据业务规则预设决策树;所述决策树包括业务条件及比对结果;
根据所述决策树中的比对结果,确定流程流转。
9.按照权利要求8所述的方法,其特征在于,所述根据业务规则预设决策树,包括:
解析业务规则,获取业务规则中包含的业务要素;
对所述业务要素配置业务条件,判断业务要素是否满足业务条件,获取比对结果。
10.按照权利要求9所述的方法,其特征在于,所述判断业务要素是否满足业务条件,获取比对结果,包括:
建立第一数据库和第二数据库,所述第一数据库中包含模型识别数据;所述第二数据库中包含人工录入数据;
根据业务要素,分别从第一数据库和第二数据库中提取业务要素对应的数据,判断两者是否一致,若一致,则比对结果正确;若不一致,则比对结果错误。
11.一种票据审核系统,其特征在于,包括:
构建模块:用于获取含有票据的图片,对图片中的票据进行识别,构建专项模型;
训练模块:用于对所述专项模型进行训练;
审核模块:用于利用训练后的专利模型对票据进行审核。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云计算有限公司,未经苏宁云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910577167.7/1.html,转载请声明来源钻瓜专利网。