[发明专利]一种面向多源实例迁移学习的样本筛选和权重计算方法在审
申请号: | 201710406537.1 | 申请日: | 2017-06-02 |
公开(公告)号: | CN107273922A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 李维华;金宸;姬晨;王顺芳 | 申请(专利权)人: | 云南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 云南派特律师事务所53110 | 代理人: | 董建国 |
地址: | 650091*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 实例 迁移 学习 样本 筛选 权重 计算方法 | ||
1.面向多源实例迁移学习的样本筛选和权重计算方法,其特征在于包括以下步骤:
步骤1:输入在特征集X={x1,x2,……,xm}和标签属性y上的n个源领域数据集,…,和一个目标领域有标签数据集;和一个在特征集X={x1,x2,……,xm}上的目标领域无标签数据集
;;
步骤2:在数据集上分别计算协方差阵,及其特征值v1={v11,v12,…,v1m},v2={v21,v22,…,v2m},…,vn={vn1,vn2,…,vnm};
步骤3:将分别归一化得到w1={w11,w12,…,w1m},w2={w21,w22,…,w2m},…,wn={wn1,wn2,…,wnm};
步骤4:分别计算与的n个距离矩阵R1,R2,…,Rn,
,1≤k≤n;
,表示的第i个样本与的第j个样本之间的距离;
步骤5:分别在R1,R2,…,Rn中,用每一行i的平均距离,定义中第i个样本与的特征距离,分别得到为,,…,,即是Rk中第i行中的平均值;分别计算中最小的p个值,并根据在中选择对应p个样本得到,即在中选择与平均距离最近的p个样本为;
步骤6:分别计算的初始样本权重向量,,…,,其中,将归一化;
步骤7:使用n个源样本到目标的n个特征距离向量,,…,作为迭代训练分类器过程中,更新源样本权重的一个指标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710406537.1/1.html,转载请声明来源钻瓜专利网。