[发明专利]分类器应用方法及装置有效
申请号: | 202010505890.7 | 申请日: | 2020-06-05 |
公开(公告)号: | CN111639718B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 童楚婕;彭勃;栾英英;严洁;徐晓健;李福洋 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 薛娇 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 应用 方法 装置 | ||
本发明提供了一种分类器应用方法及装置,其中方法包括:接收待识别图像;输入所述待识别图像至分类器获得分类器的分类结果;其中,所述分类器由真实训练样本集和经噪声发生器输出的伪造训练样本集训练后获得,所述噪声发生器随机地向真实训练样本中添加噪声获得含有图像破坏的伪造训练样本;输出所述分类结果。由于采用真实训练样本集之外的其它训练样本训练分类器,所以训练后获得的分类器可以识别真实训练样本集之外的图像,从而提高分类器的鲁棒性。
技术领域
本申请涉及通信技术领域,尤其涉及分类器应用方法及装置。
背景技术
深度学习在计算机视觉、语音识别等领域有很多突破性的进展和应用。但众所周知,如果训练样本集和测试样本集的分布不同,则机器模型的准确性会降低。即由于训练样本集大小和种类有限,若测试样本集中包含训练样本集所不具有种类的测试样本,则会导致机器模型缺少鲁棒性。
在图像识别领域中训练样本集和测试样本集会出现分布不同的情况。例如,训练样本集中未包含受到某种类型破坏的图像,基于训练样本集训练获得分类器。在测试样本集包含受到该种类型破坏图像情况下(例如干净票据上多一些折痕或者划线),分类器对于测试样本集中受到破坏图像的识别准确率会大大降低。
为了避免上述情况,通常会利用数据增强方法向训练样本集中添加噪声,以来提高基于训练样本集训练后获得分类器的鲁棒性。
发明内容
申请人研究过程中发现:
可以采用对抗式生成网络(GAN)来提高分类器的准确率,对抗式生成网络中数据增强过程为:生成网络向真实图像中添加噪声以构建与真实图像尽可能相似的伪造图像,利用真实图像和伪造图像来训练分类器,以便分类器能够准确分别出真实图像和伪造图像,以便提高分类器的准确率。
虽然对抗式生成网络中的生成网络可以在构建伪造图像时添加噪声来训练生成器和判别器,但是对抗式生成网络中的生成器的目标是利用生成器将噪声分布不断迭代,进而逼近训练集的真实分布,最终生成的伪造图像与真实图像尽可能相同,从而使得判别器分辨不出样本是生成的还是真实的。。
虽然对抗式生成网络给生成器中添加噪声,但是由于添加噪声的目的是使伪造图像与真实图像尽可能接近,所以伪造图像中并未添加真实图像之外的图像破坏。也即,对抗式生成网络中的生成网络并未提供超出训练样本集之外的图像破坏类型。
鉴于此,本申请提供一种分类器应用方法及装置,其中的分类器借助于训练样本集和由噪声发生器输出的伪造样本集进行训练后获得,噪声发生器可以尽可能的输出与训练样本集中样本包含不同图像破坏类型的伪造样本,从而提高分类器的鲁棒性。
为了实现上述目的,本发明提供了下述技术特征:
一种分类器应用方法,包括:
接收待识别图像;
输入所述待识别图像至分类器获得分类器的分类结果;其中,所述分类器由真实训练样本集和经噪声发生器输出的含图像破坏的伪造训练样本集训练后获得,所述噪声发生器随机地向真实训练样本中添加噪声获得伪造训练样本;
输出所述分类结果。
可选的,在接收待识别图像之前还包括:
迭代训练所述分类器和所述噪声发生器,直到所述分类器达到训练结束条件;
利用测试样本集验证所述分类器;
若所述分类器的准确率大于预设准确率,则保存所述分类器;
若所述分类器的准确率不大于预设准确率,则进入所述迭代训练所述分类器和所述噪声发生器,直到所述分类器达到训练结束条件的步骤。
可选的,所述迭代训练所述分类器和所述噪声发生器,直到所述分类器达到训练结束条件包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010505890.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种控制虚拟对象展示状态的方法及装置
- 下一篇:一种对端生成方法及系统