[发明专利]一种基于流形迁移学习的数据标定方法及系统在审
申请号: | 201810305890.5 | 申请日: | 2018-04-08 |
公开(公告)号: | CN108960270A | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 陈益强;王晋东;冯文杰;忽丽莎 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标定 流形 标签 特征数据 目标域 源域 目标特征向量 数据标定 迁移 目标流 源特征 向量 大规模数据 主成分分析 运行效率 映射 学习 统计 | ||
1.一种基于流形迁移学习的数据标定方法,其特征在于,包括:
步骤1、获取已标定标签的特征数据作为源域,获取待标定标签的特征数据作为目标域,对该源域和该目标域分别进行主成分分析,得到源特征向量和目标特征向量;
步骤2、将该源特征向量和该目标特征向量分别映射至流形空间,以得到该源域在该流形空间中的源流形特征和该目标域在该流形空间中的目标流形特征;
步骤3、统计该源域具有的标签种类,并根据该标签种类下的特征数据个数,得到每一类标签下该源流形特征的平均值,并根据该平均值和该目标流形特征间的距离,为该目标域中的特征数据标定标签。
2.如权利要求1所述的基于流形迁移学习的数据标定方法,其特征在于,步骤2中该流形空间为格拉斯曼流形空间。
3.如权利要求2所述的基于流形迁移学习的数据标定方法,其特征在于,通过将该源特征向量和该目标特征向量分别映射至该格拉斯曼流形空间,其中z为该源流形特征或该目标流形特征,x为该源特征向量或该目标特征向量,G的确定方法包括:
Ps为该源特征向量,Rs是和Ps正交的矩阵,T代表矩阵的转置,Λ1,Λ2,Λ3均为对角矩阵,U1、U2分别为Ps和Rs的矩阵奇异值分解结果。
4.如权利要求1所述的基于流形迁移学习的数据标定方法,其特征在于,该步骤3包括:用二值化变量Tct来标识该目标域中特征数据t是否属于第c类标签,Tct通过最小化下式得到:
式中dct表示该特征数据t到源域数据第c类标签的距离。
5.如权利要求4所述的基于流形迁移学习的数据标定方法,其特征在于,该特征数据t到源域数据第c类标签的距离dct的计算方法包括:
式中zt为该特征数据t在流形空间中的特征,Sc为该平均值。
6.一种基于流形迁移学习的数据标定系统,其特征在于,包括:
主成分分析模块,用于获取已标定标签的特征数据作为源域,获取待标定标签的特征数据作为目标域,对该源域和该目标域分别进行主成分分析,得到源特征向量和目标特征向量;
流形空间映射模块,用于将该源特征向量和该目标特征向量分别映射至流形空间,以得到该源域在该流形空间中的源流形特征和该目标域在该流形空间中的目标流形特征;
标签标定模块,用于统计该源域具有的标签种类,并根据该标签种类下的特征数据个数,得到每一类标签下该源流形特征的平均值,并根据该平均值和该目标流形特征间的距离,为该目标域中的特征数据标定标签。
7.如权利要求6所述的基于流形迁移学习的数据标定系统,其特征在于,流形空间映射模块中该流形空间为格拉斯曼流形空间。
8.如权利要求7所述的基于流形迁移学习的数据标定系统,其特征在于,通过将该源特征向量和该目标特征向量分别映射至该格拉斯曼流形空间,其中z为该源流形特征或该目标流形特征,x为该源特征向量或该目标特征向量,G的确定方法包括:
Ps为该源特征向量,Rs是和Ps正交的矩阵,T代表矩阵的转置,Λ1,Λ2,Λ3均为对角矩阵,U1、U2分别为Ps和Rs的矩阵奇异值分解结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810305890.5/1.html,转载请声明来源钻瓜专利网。