[发明专利]一种面向多源实例迁移学习的样本筛选和权重计算方法在审
申请号: | 201710406537.1 | 申请日: | 2017-06-02 |
公开(公告)号: | CN107273922A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 李维华;金宸;姬晨;王顺芳 | 申请(专利权)人: | 云南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 云南派特律师事务所53110 | 代理人: | 董建国 |
地址: | 650091*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于人工智能领域,公开一种面向多源实例迁移学习的样本筛选和权重计算方法。为了充分利用目标领域中大量无标签数据和少量有标签数据,同时剔除源领域中与目标领域不太相关的样本,该发明首先在协方差和加权欧氏距离基础上定义样本之间的距离,用平均样本距离定义每一个源样本与目标领域的特征距离;其次,该发明根据特征距离在源领域中筛选出与目标领域比较相关的样本并用该距离作为样本的初始权重,将该特征距离作为动态更新源样本权重的依据之一,为多源实例迁移学习提供更有效的支持。 | ||
搜索关键词: | 一种 面向 实例 迁移 学习 样本 筛选 权重 计算方法 | ||
【主权项】:
面向多源实例迁移学习的样本筛选和权重计算方法,其特征在于包括以下步骤:步骤1:输入在特征集X={x1,x2,……,xm}和标签属性y上的n个源领域数据集,…,和一个目标领域有标签数据集;和一个在特征集X={x1,x2,……,xm}上的目标领域无标签数据集;;步骤2:在数据集上分别计算协方差阵,及其特征值v1={v11,v12,…,v1m},v2={v21,v22,…,v2m},…,vn={vn1,vn2,…,vnm};步骤3:将分别归一化得到w1={w11,w12,…,w1m},w2={w21,w22,…,w2m},…,wn={wn1,wn2,…,wnm};步骤4:分别计算与的n个距离矩阵R1,R2,…,Rn,,1≤k≤n;,表示的第i个样本与的第j个样本之间的距离;步骤5:分别在R1,R2,…,Rn中,用每一行i的平均距离,定义中第i个样本与的特征距离,分别得到为,,…,,即是Rk中第i行中的平均值;分别计算中最小的p个值,并根据在中选择对应p个样本得到,即在中选择与平均距离最近的p个样本为;步骤6:分别计算的初始样本权重向量,,…,,其中,将归一化;步骤7:使用n个源样本到目标的n个特征距离向量,,…,作为迭代训练分类器过程中,更新源样本权重的一个指标。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710406537.1/,转载请声明来源钻瓜专利网。