[发明专利]一种改进辅助分类器GAN的图像分类方法在审
申请号: | 201910142328.X | 申请日: | 2019-02-26 |
公开(公告)号: | CN109948660A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 王进;陈沅涛;王磊;何施茗;张经宇;邹勇松;夏卓群;张建明 | 申请(专利权)人: | 长沙理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 伍传松 |
地址: | 410114 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 判别器 分类器 标签 损失函数 图像分类 网络结构 卷积神经网络 分类准确率 后验概率 监督数据 输出样本 输入标签 输出 假数据 交叉熵 生成器 输出层 输出相 池化 卷积 重构 匹配 改进 网络 | ||
本发明公开了一种改进辅助分类器GAN的图像分类方法,包括:在ACGAN网络结构的基础上,将判别器的部分卷积层改为池化层,让生成样本在判别器中的特征输出与真实样本在判别器中的特征输出相匹配,在判别网络的输出层连接Softmax分类器,输出样本标签的后验概率估计值;将真实样本看成有标签的监督数据,生成样本看成有标签的假数据,利用样本的真假属性以及样本的输出标签与输入标签的交叉熵损失函数重构生成器和判别器的损失函数。该方法与原始ACGAN方法及同等深度网络结构的卷积神经网络相比,具有更好的分类准确率。
技术领域
本发明涉及图像分类技术领域,具体涉及一种改进辅助分类器GAN的图像分类方法。
背景技术
图像分类是图像处理的热点研究问题,目前最优的方法是深度卷积神经网络(DCNN)方法。DCNN本质上是一种更加有效的特征提取方法,将提取的特征作为分类器的输入从而实现分类。此类网络最大的缺点是只能利用人工提供的样本,模型不能学习样本的空间分布,不能更深层次地理解样本的内在结构,这无疑会影响模型的最终分类效果。
生成模型是一种能够学习到数据的潜在分布并生成新样本的模型。传统的生成模型有高斯模型、贝叶斯网络、S型信度网、高斯混合模型GMM、多项混合模型MMM、隐马尔科夫模型和隐马尔科夫随机场模型等。2014年,Ian J.Goodfellow在总结传统生成网络的优缺点的基础上,提出了生成对抗网络(Generative Adversarial Network,GAN)。GAN的核心思想是同时训练两个相互对抗的网络:生成网络(Generative Network,G)和判别网络(Discriminative Network,D)。训练判别网络使其能将真实样本和生成网络生成的伪样本区分开,其本质是一个二分类问题;训练生成网络使其生成尽可能看似真实的样本,让判别器错误的将其判别为真样本,达到以假乱真的效果。然而,GAN属于无监督学习范围,与其他生成式模型相比,这种不需要预先建模的方式存在可控性不佳的缺点。
为此,现有技术提出了一种将GAN与卷积神经网络(Convolutional NeuralNetwork,CNN)相结合的生成网络模型DCGAN(Deep Convolutional GANs),从而达到生成网络训练过程更加稳定,生成图像更加清晰的目的。条件生成式对抗网络(ConditionalGenerative Adversarial Networks,CGAN)训练时在生成器和判别器中都加入了图像的类别标签,从而实现图像的定向生成;基于辅助分类器生成对抗网络(Auxiliary ClassifierGenerative Adversarial Networks,ACGAN)与CGAN一样,也是利用图像的标签信息进行训练,但此时只是在生成器中加入标签信息,从而实现图像的定向生成。CGAN、ACGAN的应用将GAN带入到监督学习的范畴,可以达到标签与生成图像相对应的效果,其中ACGAN在CGAN的基础上做了进一步改进,并结合了InfoGAN中最大互信息的思想,实验表明,ACGAN能生成更加高清的样本。但是传统的ACGAN网络的判别器是一个天然的分类器,用于图像分类时,存在训练速度慢、训练过程不稳定、判别效果不佳等诸多问题。
发明内容
针对现有技术的上述不足,本发明的目的是提供一种改进辅助分类器GAN的图像分类算法(Image Classification Based on Auxiliary Classifier GAN,IC-ACGAN)。
为实现上述目的,本发明采用以下技术方案:
一种改进辅助分类器GAN的图像分类方法,包括:
在ACGAN网络结构的基础上,将判别器的第3卷积层、第5卷积层分别改为池化层,并引入特征匹配(FM),使生成样本在判别器中的特征输出与真实样本在判别器中的特征输出相匹配,FM的目标函数如式(1)所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙理工大学,未经长沙理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910142328.X/2.html,转载请声明来源钻瓜专利网。