[发明专利]票据识别模型的训练方法、票据识别方法及装置在审
申请号: | 202110674751.1 | 申请日: | 2021-06-17 |
公开(公告)号: | CN113392835A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 程鼎刚;刘炼;霍志翠;陈涛 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 鄢功军 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 识别 模型 训练 方法 装置 | ||
本公开提供了一种票据识别模型的训练方法,可以应用于金融领域及人工智能技术领域。该票据识别模型的训练方法包括:获取样本数据集,其中,样本数据集中包括样本图像组,样本图像组中包括真实票据图像和与真实票据图像相关联的虚假票据图像;将虚假票据图像输入待训练票据识别模型的生成器,将真实票据图像输入待训练票据识别模型的鉴别器,以便利用样本数据集训练待训练票据识别模型,得到训练完成的票据识别模型;其中,生成器和鉴别器是基于实例正则化层构建得到的。本公开还提供了一种票据识别方法、票据识别模型的训练装置、票据识别装置、设备、存储介质和程序产品。
技术领域
本公开涉及金融领域及人工智能技术领域,更具体地,涉及一种票据识别模型训练方法、票据识别方法及装置。
背景技术
票据类业务是银行的核心业务之一,票据类业务通常伴随这各种各样的形式,不同票据业务之间的处理规则和逻辑无通用规律可循,彼此之前无法实现互联互通。现如今银行黑产越发猖獗,虚假票据充斥于各种线上票据办理业务中,给银行针对票据进行审核、办理、拒绝等处理带来了额外的人力及财力成本,大幅度降低业务办理效率,同时也给用户带来了极差的体验感。
相关技术中通常采用人工鉴别票据真假的方式,在实现本公开构思的过程中,发明人发现相关技术中存在人工鉴别的成本较高且准确率较低的问题。
发明内容
有鉴于此,本公开提供了一种票据识别模型的训练方法、票据识别方法、票据识别模型的训练装置、票据识别装置、设备、存储介质和程序产品。
本公开的一个方面提供了一种票据识别模型的训练方法,包括:
获取样本数据集,其中,上述样本数据集中包括样本图像组,上述样本图像组中包括真实票据图像和与上述真实票据图像相关联的虚假票据图像;
将上述虚假票据图像输入待训练票据识别模型的生成器,将上述真实票据图像输入上述待训练票据识别模型的鉴别器,以便利用上述样本数据集训练上述待训练票据识别模型,得到训练完成的票据识别模型;
其中,上述生成器和上述鉴别器是基于实例正则化层构建得到的。
根据本公开的实施例,上述第一特征提取模块适用于对输入的图像数据执行以下操作:
利用上述图像数据的自身数据对上述图像数据进行插值上采样,输出第一图像数据;
将上述第一图像数据输入上述第一卷积层,输出第二图像数据;
将上述第二图像数据输入上述实例正则化层,输出第三图像数据。
根据本公开的实施例,上述将上述第二图像数据输入上述实例正则化层,输出第三图像数据包括:
根据上述第二图像数据的高和宽,计算得到第一数据;
根据上述第一数据、上述第二图像数据计算得到第二数据;
根据上述第一数据和上述第二数据,生成上述第三图像数据。
根据本公开的实施例,上述鉴别器包括第二特征提取模块,上述第二特征提取模块包括:
第三特征提取子模块,包括依次级联的第二卷积、第二实例正则化层和第一带泄露修正激活函数层;
第四特征提取子模块,包括依次级联的第三卷积、第三实例正则化层和第二带泄露修正激活函数层;
第五特征提取子模块,包括依次级联的第四卷积、第四实例正则化层和第三带泄露修正激活函数层。
根据本公开的实施例,上述将上述虚假票据图像输入待训练票据识别模型的生成器,将上述真实票据图像输入上述待训练票据识别模型的鉴别器,以便利用上述训练样本数据集训练上述待训练票据识别模型,得到训练好的票据识别模型包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110674751.1/2.html,转载请声明来源钻瓜专利网。