[发明专利]多层感知机构建缺失值填补与分类并行的多任务学习方法在审
申请号: | 202110255540.4 | 申请日: | 2021-03-09 |
公开(公告)号: | CN113076974A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 赵宏哲 | 申请(专利权)人: | 麦哲伦科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 050000 河北省*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多层 感知 机构 缺失 填补 分类 并行 任务 学习方法 | ||
1.层感知多机构建缺失值填补与分类并行的多任务学习方法,其特征在于,包括以下步骤:
S1、令{(xi,ti)|xi∈Rs;ti∈Rc,i=1,2,…,n}表示带类标签的不完整数据集;
S2、在不完整数据集的拟合任务中,输出层第j中,1≤j≤m个神经元用于拟合符号为aj的不完整属性,神经元在计算输出yij时,需剔除输入所包含的并根据其他输入值展开求解;
令其中r1j种除第aj置0外其余均设定成1,同时r2=[1]c*1;用于标记中每个元素是否参与计算;
S3、在分类任务中,用zij表示输出层j+m个神经元的输出值,在实际运行中需要剔除输入中的类标签ti,并利用泰勒级数对xi展开,同时函数变量变种为rM=[r1T,r2T],r1=[1],r2=[0],用于标记输入中每个元素是否参与运算;
S4、模型训练时,在完整样本的基础上进行,开始参与填补计算时,分两种情况:第一种,当不完整样本的类标签已知时,第二种,当不完整样本的类标签未知时。
2.根据权利要求1所述的多层感知机构建缺失值填补与分类并行的多任务学习方法,其特征在于:在S1操作步骤中,其中:
s—属性个数;
c—类的数量;
n—样本数量;
xi=[xi1,xi2,…xis]T是数据集中第i个样本;
ti=[ti1,ti2,…tic]T是样本xi的类标签。
3.根据权利要求1所述的多层感知机构建缺失值填补与分类并行的多任务学习方法,其特征在于:在S2操作步骤中,针对第j(1≤j≤m)个输出层神经元,第k个隐藏层神经元的输出式为:
其中:
φ(·)表示隐藏层激活函数;
表示输入层神经元与隐藏层神经元的连接权重;
表示隐藏层神经元的阈值;
通过上式计算,不完整数据属性拟合时的网络输出为:
其中:
θ(·)表示输出层激活函数;
表示隐藏层神经元与输出层神经元的连接权重;
表示输出层神经元的阈值。
4.根据权利要求1所述的多层感知机构建缺失值填补与分类并行的多任务学习方法,其特征在于:在S3操作步骤中,针对j+m个输出神经元,隐藏层中第k个神经元的输出值如下计算:
网络输出zij的计算方式为:
其中mij的计算公式如下:
网络训练时,多任务学习模型的代价函数为:
E=λEM+(1-λ)Es;
其中,λ表示两个任务在训练时的权重分配,EM表示分类误差,ES表示不完整属性的拟合误差,具体表达式为:
NCO表示数据集中完整样本的序号集合。
5.根据权利要求1所述的多层感知机构建缺失值填补与分类并行的多任务学习方法,其特征在于:在S4操作步骤中,具体步骤如下:
S401、对不完整样本xi进行预填补;
S402、设不完整样本xi属于第j类,对应的类标签为中除了j个元素为1外,其余全为0;
S403、将预填补后的xi和输入模型,计算网络输出yi和zi;
S404、根据输出zi计算样本xi属于j类的概率pj=zij;
S405、设置j←j+1,并返回S402步骤;
S406、计算最大概率值该概率值对应的类别就是网络最终预测的样本类别;
S407、将所求的的类别和预填补后的样本输入网络,同时将与缺失值对应的网络输出作为填补值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于麦哲伦科技有限公司,未经麦哲伦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110255540.4/1.html,转载请声明来源钻瓜专利网。