[发明专利]一种银行电子回单PDF文件识别方法、设备及介质在审
申请号: | 202310108101.X | 申请日: | 2023-02-09 |
公开(公告)号: | CN116030481A | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 钟如玉;刘辉;周娜 | 申请(专利权)人: | 浪潮通用软件有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/19;G06V30/148;G06Q40/02 |
代理公司: | 北京君慧知识产权代理事务所(普通合伙) 11716 | 代理人: | 肖鹏 |
地址: | 250101 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 银行 电子 回单 pdf 文件 识别 方法 设备 介质 | ||
本申请公开了一种银行电子回单PDF文件识别方法、设备及介质,方法包括:针对不同的银行电子回单,制定相应的PDF识别模板;接收PDF格式的银行电子回单,并根据银行电子回单选择适配的PDF识别模板,以根据适配的PDF识别模板对银行电子回单进行信息识别;根据识别到的回单信息,在系统中匹配已存的业务单据,并与业务单据进行关联。通过预先设置的各类PDF识别模板,能够在收到PDF格式的银行电子回单时,通过该识别模板对银行电子回单进行自动化的单据信息识别,从而能够实现快速批量处理PDF,并实现自动录入系统以及业务单据比较关联,降低人工成本,提高了工作效率。
技术领域
本申请涉及计算机领域,具体涉及一种银行电子回单PDF文件识别方法、设备及介质。
背景技术
当前银行电子回单通常为PDF格式,用户在处理PDF时,通常需要手工将PDF信息录入到系统中,另外需要人工比对银行电子回单信息与系统单据信息,不仅工作效率低,而且出错频率高。
现有的一些PDF处理软件可以识别PDF信息,但是难以自动将相关数据录入系统,也难以实现单据信息的比较。
发明内容
为了解决上述问题,本申请提出了一种银行电子回单PDF文件识别方法,包括:
针对不同的银行电子回单,制定相应的PDF识别模板;
接收PDF格式的银行电子回单,并根据所述银行电子回单选择适配的PDF识别模板,以根据所述适配的PDF识别模板对所述银行电子回单进行信息识别;
根据识别到的回单信息,在系统中匹配已存的业务单据,并与所述业务单据进行关联。
在一个示例中,针对不同的银行电子回单,制定相应的PDF识别模板,具体包括:
针对每个具有需求的银行,确定该银行对应的各类银行电子回单,并针对每类银行电子回单,确定其中包含的回单信息的坐标数据;
根据所述坐标数据制定根据该类银行电子回单对应的PDF识别模板。
在一个示例中,根据识别到的回单信息,在系统中匹配已存的业务单据,具体包括:
确定已识别到的回单信息;
对所述回单信息进行异常识别,并将识别到的异常信息进行修改;
根据修改后的回单信息,在系统中匹配已存的业务单据。
在一个示例中,对所述回单信息进行异常识别,并将识别到的异常信息进行修改,具体包括:
确定所述回单信息中所包含的指定类别的信息,所述指定类别包括付款人信息、收款人信息、备注信息、金额信息;
若所述付款人信息、所述收款人信息不在预设的列表中,所述备注信息中出现预设词汇,所述金额信息不符合预设范围,则认为出现异常;
将识别到的异常信息进行修改,并将修改痕迹进行人工审核。
在一个示例中,与所述业务单据进行关联,具体包括:
若确定匹配到已存的多个相同的业务单据,则获取该多个业务单据的单据属性,所述单据属性包括创建时间、更新频率、最后一次更新时间;
根据所述单据属性,在该多个业务单据中选择指定业务单据,用于进行关联。
在一个示例中,制定相应的PDF识别模板之后,所述方法还包括:
确定所述PDF识别模板中所包含的字符;
在所述所包含的字符之外,选取特殊字符,并通过所述特殊字符来规定所述PDF识别模板,以通过所述特殊字符来自动选取所述PDF识别模板。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮通用软件有限公司,未经浪潮通用软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310108101.X/2.html,转载请声明来源钻瓜专利网。