[发明专利]一种发票解析方法、装置、报销系统、设备及存储介质在审

专利信息
申请号: 202210071201.5 申请日: 2022-01-21
公开(公告)号: CN114429393A 公开(公告)日: 2022-05-03
发明(设计)人: 周佩林;马群旺;李龙吉;吴昊;王志家;解庆雷;宫剑 申请(专利权)人: 中移在线服务有限公司黑龙江分公司
主分类号: G06Q40/00 分类号: G06Q40/00;G06V30/40
代理公司: 哈尔滨市晨晟知识产权代理有限公司 23219 代理人: 宫晓平
地址: 150011 黑龙*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 发票 解析 方法 装置 报销 系统 设备 存储 介质
【说明书】:

发明提出涉及一种发票解析方法、装置、报销系统、设备及存储介质,属于发票解析技术领域。包括发票上传模块、获取发票模块、预处理模块、分析模块和匹配模块;所述发票上传模块、获取发票模块、预处理模块、分析模块和匹配模块依次连接;所述发票上传模块用于上传带有加密信息的发票;所述获取发票模块用于获取pdf文件发票;所述预处理模块用于对发票进行预处理得到配置对象;所述分析模块用于获得发票文字信息和图像信息;所述匹配模块用于将预处理好的文字信息字段进行匹配并存入数据库。解决了解析精准度低、人工消耗大、开发耗时长,对空间和性能要求高的技术问题,实现了开发耗时短、人工消耗小、解析准确度高的技术效果。

技术领域

本申请涉及发票解析方法,尤其涉及一种发票解析方法、装置、报销系统、设备及存储介质,属于发票解析技术领域。

背景技术

随着时代的发展,无纸化票据成为一种趋势,各个行业的公司已经开始选择电子发票,电子发票得到了大力的发展,电子发票慢慢替代纸质发票。在传统的报销手续中,通常需要手动输入每张电子发票里的信息,浪费了大量的人力物力;而且人工输入经常有输入错误的现象发生,导致发票无法核销。因此,自动解析电子发票信息能够提高报销人员的工作效率,以及降低手动录入的错误率。为了改进人工输入的弊端,采用使用AI识别;但采用AI识别的方法存在的弊端是,开发耗时长,服务器内存空间和性能要求高、准确度不高。

综上所述,现有的发票解析方法解析精准度低、人工消耗大、开发耗时长,对空间和性能要求高。

因此,亟待一种解析准确度高、人工消耗小、耗时长短的一种发票解析方法、装置、报销系统、设备及存储介质。

发明内容

在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。

鉴于此,为解决现有技术中存在的解析精准度低、人工消耗大、开发耗时长,对空间和性能要求高的技术问题,本发明提供一种发票解析方法、装置、报销系统、设备及存储介质。

方案一:一种发票解析方法,包括以下步骤:

步骤一、管理后台通过post接口采用加密方式上传发票至服务端;

步骤二、通过验签并解密方式,获取PDF文件发票;

步骤三、对发票进行预处理,具体方法是,通过读取数据库中配置好需要分析的字段,再通过字段和内容的匹配关系,整理成json对象;

步骤四、创建pdf分析器对象,读取http请求中携带的PDF文档流内的参数和对象信息,进行图层分离得到pdf文件的json数据,所述json数据包括图像信息和文字信息;

步骤五、获得文字信息,遍历循环所有文字信息,通过预处理得到的配置对象,对pdf文件信息进行遍历,并通过正则表达式,分割文字信息,并将预处理好的文字信息字段进行匹配。

优选的,步骤四所述图层分离的具体方法是:包括以下步骤

步骤四一、创建一个线程用于图层分离,防止阻塞主线程;

步骤四二、创建一个系统自带的画板对象,通过读取http请求中携带的PDF文档流,直接将文档流绘入画板;

步骤四三、读取画板,通过系统自带的方法,将画板转换为HTML格式的对象;

步骤四四、遍历HTML格式的对象,使用深度优先遍历法,通过HTML的标签开与合,确定为一对图层,并转化为图层的json对象;

步骤四五、输出图层的json对象给http所在的线程。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移在线服务有限公司黑龙江分公司,未经中移在线服务有限公司黑龙江分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210071201.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top