[发明专利]一种具有知识迁移判别能力的数据分类方法在审
申请号: | 202210568499.0 | 申请日: | 2022-05-24 |
公开(公告)号: | CN114861813A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 李兴海;马建伟;臧绍飞;吕进锋;马超;马晓毓;张淼 | 申请(专利权)人: | 河南科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 郑州豫鼎知识产权代理事务所(普通合伙) 41178 | 代理人: | 轩文君 |
地址: | 471000 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 具有 知识 迁移 判别 能力 数据 分类 方法 | ||
1.一种具有知识迁移判别能力的数据分类方法,其特征在于,包括源域、目标域、特征空间、Softmax分类器、预测结果,其分类过程包括以下步骤:
S1:源域样本和目标域样本经特征映射后,在特征空间中可找到它们近似的相同分布;
S2:在特征空间中进行WMMD和Linear Discriminant Analysis(LDA)运算,使得具有相同特征的样本与具有不同特征的样本区分开,不同的样本标签对应不同的样本特征;
S3:Softmax分类器分别计算目标域中每个样本所对应的每个标签下的概率,选择概率值最大值对应的标签,即为该样本的标签,完成样本分类;
S4:预测结果保存目标域样本分类结果,即每个样本对应的标签。
2.根据权利要求1所述的一种具有知识迁移判别能力的数据分类方法,其特征在于,所述S1中源域由两部分组成,样本x和样本标签yx,源域用表示,目标域中只有样本,用表示,所述特征空间包括WMMD、LDA。
3.根据权利要求2所述的一种具有知识迁移判别能力的数据分类方法,其特征在于,构造系统目标函数:
J(θ)=J1(θ)+α·J2(θ)+β·J3(θ)+λ·J4(θ)+μ·J5(θ) (1)
其中,
4.根据权利要求3所述的一种具有知识迁移判别能力的数据分类方法,其特征在于,所述的θ是系统所有项参数,即系统需要通过训练确定的参数;
J1(θ)是Softmax回归的代价函数;
J2(θ)是基于WMMD计算结果;
J3(θ)用于通过条件分布和边沿分布减少Softmax回归概率输出层中,域间的分布差异;
J4(θ)是模型参数的稀疏控制项,防止模型出现过拟合现象;
J5(θ)是系统中LDA计算项;
α,β,λ,μ分别是J2(θ),J3(θ),J4(θ),J5(θ)的平衡参数;
L0和W0分别是边沿分布矩阵和边沿分布权重系数矩阵;
Lc和Wc分别是条件分布矩阵和条件分布权重系数矩阵;
Gb是类间矩阵,Gu是类内矩阵,Gv是总散度矩阵,Gv=Gb+Gu。
5.根据权利要求4所述的一种具有知识迁移判别能力的数据分类方法,其特征在于,所述L0矩阵由下式计算得:
其中,是源域,是目标域,x是相应域中的样本,n是相应域中的样本数量;
权重系数W0定义如下:
其中,是第i个样本的权重系数,是源域或目标域样本的均值;
Lc矩阵根据下式计算:
其中,是属于类c的源域样本集,是源域样本xi的正确标签,相应的,是属于类c的目标域样本集;
类权重系数Wc的定义如下:
其中,是第i个属于类c的样本的权重系数,是源域或目标域属于类c的样本的均值;
类间矩阵计算如下:
这里表示所有样本的均值;
类内矩阵计算如下:
这里表示第i类样本的均值,表示总样本中是i类样本的数据子集;
由式(11)和式(12)得总散度矩阵:
6.根据权利要求5所述的一种具有知识迁移判别能力的数据分类方法,其特征在于,最小化目标函数J(θ)得到参数θ的最优解,目标函数J(θ)针对属于第j类参数θ求偏导,结果为:
其中,
模型参数由下式更新,
取得模型参数θ后,对目标域进行分类,每一个测试样本x属于类别j的概率为:
通过式(21)计算出x属于所有类别的概率,取最大概率所对应的类别即为x的分类类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南科技大学,未经河南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210568499.0/1.html,转载请声明来源钻瓜专利网。