[发明专利]基于循环一致生成对抗网络的不平衡数据分类方法在审
| 申请号: | 202210625335.7 | 申请日: | 2022-06-02 |
| 公开(公告)号: | CN114943300A | 公开(公告)日: | 2022-08-26 |
| 发明(设计)人: | 王利娟;杨绪前 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 侯琼;王品华 |
| 地址: | 710071*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 循环 一致 生成 对抗 网络 不平衡 数据 分类 方法 | ||
1.一种基于循环一致生成对抗网络的不平衡数据分类方法,包括如下步骤:
(1)对原始数据集进行预处理,得到预处理后数据集:
(2)构建孪生数据对集合:
(2.1)计算预处理后数据集中所有类的平均数量,将该平均数量所在十进制单位作为数量单位,判定少于该数量单位的类别为目标少数类;
(2.2)以步骤(2.1)得到的数量单位作为孪生数据对的目标构建数量,从目标少数类中随机选择数据构造孪生数据对;
(2.3)将所有所有孪生数据对以集合形式输出;
(3)建立循环一致生成对抗网络模型:
(3.1)构建结构相同的两个生成器,即第一生成器GXY和第二生成器GYX,然后构建这两个生成器的共同优化目标,即循环一致损失函数
其中,x表示单个训练数据,Pdata(x)表示数据在训练集上的概率分布,x~Pdata(x)表示数据x服从概率分布Pdata(x),表示对服从分布Pdata(x)的每个训练数据x计算函数期望,y表示随机噪声数据,Pdata(y)表示噪声数据分布,表示对每个随机噪声数据y计算函数期望,GXY(x)=Fake_Y表示生成器基于数据y合成的假数据,GYX(y)=Fake_X表示生成器基于数据x合成的假数据;
(3.2)构建结构相同的两个判别器,即第一判别器DX和第二判别器DY,然后构建这两个判别器的优化目标,即第一对抗损失函数和第二对抗损失函数
(3.3)根据循环一致损失函数第一对抗损失函数和第二对抗损失函数构建全局优化目标,即循环一致生成对抗网络模型:
其中,λ为控制循环一致损失函数的相对重要性参数;
(4)合成目标少数类样本数据:
设定最大迭代次数为E、停止迭代阈值为ε,用孪生数据对集合中的数据迭代训练步骤(3)中构建的网络模型,直到当前迭代的函数值小于阈值ε或达到最大迭代次数E时,输出合成的假数据GXY(x)=Fake_Y,即合成的目标少数类样本数据;
(5)将合成的目标少数类样本数据补入预处理后数据集中,得到平衡训练数据集,并使用平衡数据集训练基础分类器,完成对不平衡数据的分类。
2.根据权利要求1所述的方法,其特征在于:步骤(1)中对原始数据集进行预处理,包括如下步骤:
(1.1)对数据集进行缺失值、空值和去冗余处理;
(1.2)对步骤(1.1)处理后所得数据集中的状态信息项进行单热编码;
(1.3)对步骤(1.2)所得数据集中的数值项进行归一化处理;
(1.4)根据类别标签,将归一化处理后的数据集拆分为多个子集,得到预处理后数据集。
3.根据权利要求1所述的方法,其特征在于:步骤(2.2)中构造的孪生数据对,是基于少数类样本配对而成,根据配对样本的类别是否相同,分为类别相同的正样本对和类别不同的负样本对。
4.根据权利要求1所述的方法,其特征在于:步骤(3.2)中两个判别器的优化目标,为两个组合优化目标,具体如下:
将第一生成器GXY和第二判别器DY进行组合,构建第一组合优化目标,即第一对抗损失函数将第二生成器GYX和第一判别器DX进行组合,构建第二组合优化目标,即第二对抗损失函数
5.根据权利要求1所述的方法,其特征在于:步骤(3.1)中的两个生成器和步骤(3.2)中的两个判别器,其二维卷积层采用的激活函数均为带泄露修正线性单元LeakyReLU,梯度优化方式均为自适应梯度下降Adam。
6.根据权利要求1所述的方法,其特征在于:步骤(3.3)中全局优化,其优化方式采用随机梯度下降SGD。
7.根据权利要求1所述的方法,其特征在于:步骤(5)中的基础分类器根据需要进行选择,可选的分类器至少包括逻辑回归、K近邻算法、决策树、支持向量机、随机森林、高斯朴素贝叶斯和深度神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210625335.7/1.html,转载请声明来源钻瓜专利网。





