[发明专利]一种基于去跟踪自编码器的动态缺失值填补方法在审
申请号: | 201910489687.2 | 申请日: | 2019-06-06 |
公开(公告)号: | CN110309907A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 张立勇;赖晓晨;吴霞 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪;侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于去跟踪自编码器的动态缺失值填补方法,属于数据挖掘技术领域。本发明包括两部分:网络模型部分和填补方案部分。在网络模型部分,为强化不完整样本中缺失值对现有数据的依存关系,本发明在传统自编码器的基础上设计了隐藏节点的计算规则,并构建了去跟踪自编码器;在填补方案部分,针对数据的不完整性,本发明设计了一种基于缺失值动态处理机制的填补方案,将缺失值视为代价函数的未知变量并基于优化算法动态调整其估计值,填补在网络训练结束时伴随式完成。本发明强化了网络模型对属性间互相关性的学习能力,并充分利用了不完整数据集中所有的数据信息,具有较理想的填补精度。 | ||
搜索关键词: | 填补 编码器 网络模型 跟踪 数据挖掘技术 代价函数 动态处理 动态调整 计算规则 数据信息 完整数据 网络训练 学习能力 依存关系 隐藏节点 优化算法 伴随式 构建 样本 | ||
【主权项】:
1.一种基于去跟踪自编码器的动态缺失值填补方法,包括网络模型和填补方案两个部分,其特征在于:第一部分:网络模型设计隐藏层节点的计算规则,并搭建去跟踪自编码器;在与输入层相连的第一个隐藏层中,节点的计算规则为:
式中,
表示在剔除网络输入xij后,第一个隐藏层第k个节点得到的输出;σ(·)表示隐藏层的激活函数;wlk表示输入层第l个节点和第一个隐藏层第k个节点的连接权重;ak表示第一个隐藏层第k个节点的阈值;在后续的第h个隐藏层中,节点的计算规则为:
式中,
表示在剔除网络输入xij后,第h个隐藏层第k个节点得到的输出;mh‑1表示第h‑1个隐藏层的节点个数;
表示第h‑1个隐藏层第l个节点和第h个隐藏层第k个节点的连接权重;
表示在剔除网络输入xij后,第h‑1个隐藏层第l个节点得到的输出;
表示第h个隐藏层第k个节点的阈值;令yi=[yi1,yi2,......,yis]T表示网络的最终输出,其中,yij是剔除其相应网络输入xij后,基于其他网络输入计算得到的结果;第二部分:填补方案将缺失值视为未知变量,设计基于缺失值动态处理的填补方案;令ei表示输出yi和输入xi的误差:
式中,XP是不完整数据集中所有数据的集合;XM是不完整数据集中所有缺失值的集合;
是缺失值估计;网络代价函数为:
式中,n为样本容量;MVPT的填补流程为:步骤1:随机初始化网络参数包括权重和阈值,缺失值估计;步骤2:将含缺失值估计的不完整数据集输入网络模型;步骤3:基于优化算法更新网络参数,缺失值估计;步骤4:基于更新后的缺失值估计填补不完整数据集的缺失值;步骤5:若训练未达到终止条件,返回步骤2;否则,利用与缺失值对应的网络输出填补缺失值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910489687.2/,转载请声明来源钻瓜专利网。