[发明专利]一种基于生成对抗学习填补金融数据的方法在审
申请号: | 202210502063.1 | 申请日: | 2022-05-10 |
公开(公告)号: | CN114881762A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 张永全;曹昊;张宇权;齐少春 | 申请(专利权)人: | 浙江财经大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06N3/04;G06N3/08 |
代理公司: | 杭州兴知捷专利代理事务所(特殊普通合伙) 33338 | 代理人: | 林振兴 |
地址: | 310012 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 对抗 学习 填补 金融 数据 方法 | ||
1.一种基于生成对抗学习填补金融数据的方法,其特征在于:该方法包括如下步骤:
步骤一:数据分类和数据预处理问题
(1.1)将N个区域的银行个人信贷数据作为输入,首先判断数据是哪一类,即判断是违约数据还非违约数据,并确定是否为数据不平衡问题;
(1.2)对于不平衡的数据,或者需要操作的数据进行正则化操作;
步骤二:生成器数据生成
(2.1)对于第一步处理好的数据,将数据进行维度拓展;
(2.2)对于生成器的搭建过程,确定数据的基础框架,首先确定数据来源维度;
(2.3)根据(2.2)的维度,进行数据生成器的模型搭建,采用变卷积核反卷积操作,做批量正则化和激活函数;
(2.4)对于数据生成器的神经网络的块数确定的设置,设置为(2.1)中数据维度的N值;
步骤三:人脸识别分类
(3.1)采用一个二维的卷积操作,将数据放大到更高的维数,并进行标准化和激活函数;
步骤四:生成器和辨别器的训练
(4.1)进行真实数据与生成数据的加权组合,组合进入训练;
(4.2)为每一次训练设置梯度惩罚;
(4.3)加入含有梯度惩罚项的损失函数进行训练;
(4.4)多次训练得到最终的生成数据。
2.根据权利要求1所述的一种基于生成对抗学习填补金融数据的方法,其特征在于:所述的步骤一(1.2)中:对数据进行标准化,具体操作步骤为:
其中,xi为每一项数据,μ为每一项数据的均值,d为方差。
3.根据权利要求1所述的一种基于生成对抗学习填补金融数据的方法,其特征在于:所述的步骤二(2.1)中:具体的维度拓展为(b,c,h,w),其中b为数据的总条数,c默认为1,h默认为1,w为数据的具体维度。
4.根据权利要求1所述的一种基于生成对抗学习填补金融数据的方法,其特征在于:所述的步骤二(2.2)中:数据维度可以分为类似用户个人信贷历史,个人经济状况,个人用户行为等各个维度等,设置为维度为N,同时统计每一个维度中各项数据的小维度数量,计数为n。
5.根据权利要求1所述的一种基于生成对抗学习填补金融数据的方法,其特征在于:所述的步骤二(2.3)中:采用反卷积思想,其公式满足:
Hout=(Hin-1)*stride[0]-2*padding[0]+Kernel_size[0]+output_padding[0]
Wout=(Win-1)*stride[1]-2*padding[1]+Kernel_size[1]+output_padding[1]
其中,Hin代表输入数据的h值,Hout代表输出数据的h值,stride[0]代表步长的第一维大小,stride[1]代表步长的第二个维度的大小,padding[0]代表填充值的第一维的值,padding[1]代表填充值的第二维的值,Kernel_size[0]代表卷积核的第一个维度,Kernel_size[1]代表卷积核的第二个维度;output_padding[0]默认为0,output_padding[1]默认为0,
其中,反卷积操作变卷积核操作,其思想为:设定卷积核的大小为[1,m],其中m遵循(2.1)中确认的关于数据的小维度的n值,从而保证生成的数据符合某个领域的数据分布的假设。
6.根据权利要求1所述的一种基于生成对抗学习填补金融数据的方法,其特征在于:步骤(2.3)中的激活函数采用批量正则化,其公式遵循激活函数采用ReLU函数,公式为ReLU(x)=(x)+=max(0,x)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江财经大学,未经浙江财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210502063.1/1.html,转载请声明来源钻瓜专利网。