[发明专利]一种基于特征检测的OCR识别票据问题的方法及系统有效
申请号: | 201911404676.6 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111209827B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 王淼;金昌铉;程俊春;朱宇龙;马博;赵永国;刘森;黎晚晴;张君;梁惠欣 | 申请(专利权)人: | 中国南方电网有限责任公司;南方电网数字电网研究院有限公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/148;G06V10/75 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 蔡伟杰 |
地址: | 510530 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 检测 ocr 识别 票据 问题 方法 系统 | ||
本发明公开了一种基于特征检测的OCR识别票据问题的方法及系统,通过对票据图像进行背景消除并去噪处理得到第一图像;对第一图像做投影变换并去除分隔符后识别字符得到票据文本;抽取票据文本的关键词组合;将关键词组合在知识库中进行匹配得到匹配度最高的规则集作为基准规则集;若票据文本的审计内容信息大于基准规则集预设的风险阈值则发出警报信息,有效的解决了原始文件字迹清晰度、整洁度等较难识别问题,能够大批量的导入票据,并快速的对票据进行相似度识别,利用基于文本字符特征的智能识别的智能检校实现OCR识别纠错,进一步提高准确率。根据定位出的风险点快速减少了审计的工作量,提升了此类信息化系统的用户体验。
技术领域
本公开涉及OCR图像识别、模式匹配领域,具体涉及一种基于特征检测的OCR识别票据问题的方法及系统。
背景技术
票据是在涉及经济、运输等业务的载明交易、事项实际情况的书面证明,货款的支付、权利凭证的纸质或电子依据。可以以票据作为提取、消费、权限的依据,由于种类多种多样,故票据的模式匹配、定位和识别十分的困难;由于票据五花八门的种类,例如发票、机票、火车票、收据、凭条、存根、购物券等,这些不同的票据,特征词位置不一样,敏感词的表达形式也各有差异,数字的大小写也无规范,故如果票据数量多的话,在审计工作中,审计规则的内容集合,包括:发票类型、单位名称、金额的审计规则的集合,类别多种多样,故通过人工进行识别判断十分的困难,极易出错。
发明内容
本公开提供一种基于特征检测的OCR识别票据问题的方法及系统,通过对票据图像进行背景消除并去噪处理得到第一图像;对第一图像做投影变换并去除分隔符后识别字符得到票据文本;抽取票据文本的关键词组合;将关键词组合在知识库中进行匹配得到匹配度最高的规则集作为基准规则集;若票据文本的审计内容信息大于基准规则集预设的风险阈值则发出警报信息,从而快速的定位并对票据中风险信息发出警报。
本公开的目的是针对上述问题,提供一种基于特征检测的OCR识别票据问题的方法及系统,具体包括以下步骤:
S100:读取票据图像文件得到票据图像;
S200:对票据图像进行背景消除;
S300:将背景消除后的票据图像进行中值滤波处理得到第一图像;
S400:对第一图像做投影变换并去除分隔符;
S500:在去除分隔符的第一图像中识别字符特征得到字符特征图像区域并识别字符特征图像区域中的字符得到票据文本;
S600:抽取票据文本的关键词组合;
S700:计算关键词组合与知识库中的各个规则集的匹配度;
S800:将匹配度最高的规则集作为基准规则集;
S900:若票据文本的审计内容信息大于基准规则集预设的风险阈值则发出警报信息。
进一步地,在S100中,所述票据图像文件包括但不限于以PDF、jpg、jpeg、bmp等图像格式存储的票据图像,票据包括但不限于发票、机票、火车票、收据、凭条、存根、购物券。
进一步地,在S200中,对票据图像进行背景消除的方法为以下步骤:
S210:将票据图像的彩色图像转换成灰度图;
S220:根据票据图像的最高、最低灰度值对票据图像进行二值化处理,能够使票据图像的背景图基本置为0,以突出票据图像的票据区域;
S230:对票据图像作相邻像素灰度值相减,得到背景消除的票据图像,从而减小票据图像的背景影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司;南方电网数字电网研究院有限公司,未经中国南方电网有限责任公司;南方电网数字电网研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911404676.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种下料摆盘机
- 下一篇:基于波的高速旋转管状结构的转速及应变监测方法