[发明专利]一种票据识别纠错方法及装置有效
申请号: | 201610928581.4 | 申请日: | 2016-10-31 |
公开(公告)号: | CN106485243B | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 张世龙;纪录 | 申请(专利权)人: | 用友网络科技股份有限公司 |
主分类号: | G06K9/03 | 分类号: | G06K9/03;G06K9/20 |
代理公司: | 北京中恒高博知识产权代理有限公司 11249 | 代理人: | 刘洪京 |
地址: | 100094 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种票据识别纠错方法及装置,由于主要包括:进行文本预处理,票据文本与纠错历史中的生效数据匹配,匹配成功则比较识别到的票据的指定位置的一组文本与数据库存储的档案的编码、名称、属性,修正文本,记录纠错历史,在循环纠错的情况下,标记纠错历史的生效状态,使循环纠错记录失效但不删除;预先对特定种类的票据定义数值的等式关系,自动修正票据的错误数值;即利用票据各字段的语义和上下文的联系,结合ERP系统存储的档案,对票据识别结构进行交叉校验,纠正识别错误,提高准确率。 | ||
搜索关键词: | 一种 票据 识别 纠错 方法 装置 | ||
【主权项】:
1.一种票据识别纠错方法,其特征在于,包括:步骤1:OCR系统识别到的票据进入ERP系统;步骤2:进行文本预处理,票据文本与纠错历史中的生效数据匹配,匹配成功则执行步骤3,步骤3:比较识别到的票据的指定位置的一组文本与数据库存储的档案的编码、名称、属性,修正文本,记录纠错历史,在循环纠错的情况下,标记纠错历史的生效状态,使循环纠错记录失效但不删除;步骤3具体为,对于票据识别出的档案编码code、名称name、属性1 attr1、属性2 attr2,从数据库查出所有可能匹配的档案,如果查到档案,则按4项匹配、3项匹配、2项匹配的顺序遍历查询结果,如果匹配成功,则修正票据数据,同时生成一条纠错历史数据,如果纠错历史已有重复的有效记录或无效记录,则不处理;如果纠错历史有相反的记录,则标记为无效;否则插入一条纠错记录;步骤4:预先对特定种类的票据定义数值的等式关系,自动修正票据的错误数值;包括:步骤41:标记所有数值为状态未知;步骤42:校验所有等式,如果成立,则标记等式用到的数值为正确,否则标记状态未知的数值为错误,记录错误数值个数;步骤43:如果错误数值个数不为零,则查找只有一个错误数值的等式,计算出正确值,并标记数值为正确,修改错误数值个数;步骤44:重复步骤43,直到错误数值个数不变;步骤45:如果错误数值个数为零,则数值修正完成,否则进行人工处理;其中,上述等式关系,具体为:pi×ni=mi;mi×ri=ti;∑mi=M;∑ti=T;M+T=L;pi为单价,ni为数量,mi为金额,ri为税率,ti为税额,M为合计金额,T为合计税额,L为价税合,若等式成立,则等式所用的数值全部是正确的,不考虑恰好两个或多个错误数据导致等式仍然成立的情况;步骤5:票据最终存储为ERP系统的电子票据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于用友网络科技股份有限公司,未经用友网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610928581.4/,转载请声明来源钻瓜专利网。
- 上一篇:触摸指纹组件及电子设备
- 下一篇:采样方法及装置