[发明专利]票据识别模型的训练方法、票据识别方法及装置在审
申请号: | 202110674751.1 | 申请日: | 2021-06-17 |
公开(公告)号: | CN113392835A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 程鼎刚;刘炼;霍志翠;陈涛 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 鄢功军 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 识别 模型 训练 方法 装置 | ||
1.一种票据识别模型的训练方法,包括:
获取样本数据集,其中,所述样本数据集中包括样本图像组,所述样本图像组中包括真实票据图像和与所述真实票据图像相关联的虚假票据图像;
将所述虚假票据图像输入待训练票据识别模型的生成器,将所述真实票据图像输入所述待训练票据识别模型的鉴别器,以便利用所述样本数据集训练所述待训练票据识别模型,得到训练完成的票据识别模型;
其中,所述生成器和所述鉴别器是基于实例正则化层构建得到的。
2.根据权利要求1所述的方法,其中,所述生成器包括第一特征提取模块,所述第一特征提取模块包括依次级联的上采样层、第一卷积层、第一实例正则化层。
3.根据权利要求2所述的方法,其中,所述第一特征提取模块适用于对输入的图像数据执行以下操作:
利用所述图像数据的自身数据对所述图像数据进行插值上采样,输出第一图像数据;
将所述第一图像数据输入所述第一卷积层,输出第二图像数据;
将所述第二图像数据输入所述实例正则化层,输出第三图像数据。
4.根据权利要求2所述的方法,其中,所述将所述第二图像数据输入所述实例正则化层,输出第三图像数据包括:
根据所述第二图像数据的高和宽,计算得到第一数据;
根据所述第一数据、所述第二图像数据计算得到第二数据;
根据所述第一数据和所述第二数据,生成所述第三图像数据。
5.根据权利要求1所述的方法,其中,所述鉴别器包括第二特征提取模块,所述第二特征提取模块包括:
第三特征提取子模块,包括依次级联的第二卷积、第二实例正则化层和第一带泄露修正激活函数层;
第四特征提取子模块,包括依次级联的第三卷积、第三实例正则化层和第二带泄露修正激活函数层;
第五特征提取子模块,包括依次级联的第四卷积、第四实例正则化层和带第三带泄露修正激活函数层。
6.根据权利要求1所述的方法,所述将所述虚假票据图像输入待训练票据识别模型的生成器,将所述真实票据图像输入所述待训练票据识别模型的鉴别器,以便利用所述训练样本数据集训练所述待训练票据识别模型,得到训练好的票据识别模型包括:
将所述虚假票据图像输入所述生成器,输出去伪票据图像;
将所述去伪票据图像和所述真实票据图像输入所述鉴别器,以便判断所述去伪票据图像和所述真实票据图像的特征差异,得到差异信息;
所述生成器根据所述差异信息调整网络参数,直至所述差异信息满足预设条件。
7.根据权利要求6所述的方法,其中,所述差异信息包括第一差异信息和第二差异信息;其中,
所述第一差异信息包括基于一张所述真实票据图像和一张所述去伪票据图像得到的差异信息;
所述第二差异信息包括基于多张所述真实票据图像和多张所述去伪票据图像得到的差异信息。
8.根据权利要求6所述的方法,还包括:
获取增强样本数据集,以便利用所述增强样本数据集对所述生成器进行增强训练,其中,所述增强样本数据集中的增强训练样本包括所述去伪票据图像。
9.根据权利要求5所述的方法,其中,
所述第二卷积层包括128个卷积核,其中,所述卷积核的尺寸为3×3,步长为2;
所述第三卷积层包括256个卷积核,其中,所述卷积核的尺寸为3×3,步长为2;
所述第四卷积层包括512个卷积核,其中,所述卷积核的尺寸为3×3,步长为1。
10.一种票据识别方法,包括:
获取待识别票据图像;
将所述待识别票据图像输入票据识别模型,输出识别结果,其中,所述识别结果表征所述待识别票据图像是真实票据图像或虚假票据图像,所述票据识别模型由权利要求1至9任一项所述的票据识别模型的训练方法训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110674751.1/1.html,转载请声明来源钻瓜专利网。