[发明专利]一种自定义票据的识别方法、设备及介质在审
申请号: | 202111324906.5 | 申请日: | 2021-11-10 |
公开(公告)号: | CN113989817A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 王雪飞 | 申请(专利权)人: | 浪潮通用软件有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V10/26;G06V30/148;G06V10/75 |
代理公司: | 北京君慧知识产权代理事务所(普通合伙) 11716 | 代理人: | 肖鹏 |
地址: | 250101 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自定义 票据 识别 方法 设备 介质 | ||
本申请公开了一种自定义票据的识别方法、设备及介质,方法包括:接收票据模板图像,并根据票据模板图像确定参照字段、识别字段区域;并从识别模型库中确定对应的指定识别模型,并匹配对应的高频词汇,以通过高频词汇对识别结果进行修正;构建自定义票据识别模板,并将自定义票据识别模板进行分类存储;接收识别服务请求,并根据识别服务请求,在对应的启动端口加载自定义票据识别模板;接收自定义票据,并通过自定义票据识别模板对自定义票据图像进行识别处理,得到识别结果。对此类票据在保证一定识别精度基础上,极大降低了开发时长,可以使用户快速得到所需求的识别模板。
技术领域
本申请涉及图像识别领域,具体涉及一种自定义票据的识别方法、设备及介质。
背景技术
随着现代企业的发展,越来越多的企业会根据自身业务或行政流程设计多种专用于内部记录或上报的自定义单据。企业中需要填报的自定义单据很多,在工作人员对收取的自定义单据进行汇总时,通常采用手写的方式进行记录,很容易导致汇总记录不准确,同时浪费人力资源的情况。
因此,企业通常采用单据识别技术来代替人力,进行单据识别并汇总。然而,能实现单据识别的现有技术中,只能支持对固定类型的单据进行识别,难以满足实际需求。
此外,识别模型开发平台在对自定义单据对应的识别模型开发时,存在开发周期长的问题,当企业的自定义单据类型较多时,开发平台难以快速开发出自定义单据对应的识别模型。
发明内容
为了解决上述问题,即为了解决工作人员通过手写方式汇总单据,容易导致汇总记录不准确、浪费人力资源的问题,以及通过智能识别的方式对自定义单据进行识别难以满足实际需求,以及开发平台难以在短时间内开发得到大量自定义单据对应的识别模型的问题,本申请提出了一种自定义票据的识别方法、设备及介质,包括:一方面,本申请提供了一种自定义票据的识别方法,包括:接收票据模板图像,并根据所述票据模板图像确定对应的参照字段、识别字段区域;根据所述参照字段、所述识别字段区域,从识别模型库中确定对应的指定识别模型,并为所述指定识别模型匹配对应的高频词汇,以通过所述高频词汇对识别结果进行修正,其中,所述高频词汇为所述参照字段以及所述识别字段区域中出现频率大于预设阈值的词汇;根据所述票据模板图像、所述参照字段、所述识别字段区域、所述指定识别模型以及所述高频词汇,构建自定义票据识别模板,并将所述自定义票据识别模板进行分类存储;接收识别服务请求,并根据所述识别服务请求,在对应的启动端口加载所述自定义票据识别模板;接收自定义票据图像,并通过所述自定义票据识别模板对所述自定义票据图像进行识别处理,得到识别结果。
在一个示例中,接收自定义票据图像,并通过所述自定义票据识别模板对所述自定义票据图像进行识别处理,得到识别结果之前,所述方法还包括:对所述自定义票据图像进行图像优化处理,所述图像优化处理至少包括:去噪、锐化、调整亮度、平滑缩放;对所述自定义票据图像进行第一位置检测,并根据检测结果对所述自定义票据进行第一预设角度旋转处理;对所述自定义票据图像进行文本区域检测,以得到多个文本区域,并根据所述多个文本区域对所述自定义票据图像进行裁剪,得到与所述多个文本区域相同数量的多个子图像;对所述多个子图像进行第二位置检测,并根据检测结果对所述多个子图像进行第二预设角度旋转处理;确定所述多个子图像分别对应的留白区域,并对所述留白区域进行裁剪,所述留白区域为不包含文本的区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮通用软件有限公司,未经浪潮通用软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111324906.5/2.html,转载请声明来源钻瓜专利网。