[发明专利]基于混合公共因子分析器的分布式高维数据分类方法有效
申请号: | 201510916426.6 | 申请日: | 2015-12-10 |
公开(公告)号: | CN105550704B | 公开(公告)日: | 2019-01-01 |
发明(设计)人: | 魏昕;丁平船;张胜男;周亮 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 汪旭东 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于混合公共因子分析器的分布式高维数据分类方法,该方法通过网络中不同节点之间的协作,以分布式方式实现高维数据的分类。各个节点处用混合公共因子分析器来建模其高维数据的分布,整个分类分成训练和识别两个部分。在训练过程中,首先进行模型参数的初始化和局部计算,然后将计算好的三组中间变量进行广播扩散,当节点收到其邻居节点广播来的中间变量时,计算联合统计量并完成参数的估计,该过程不断迭代直至收敛。在识别阶段,待分类的数据输入任一节点,计算其关于训练出的每一类数据所对应的模型的对数似然值,将最大对数似然值对应的类别作为识别结果。采用本方法可以实现高维数据的分布式降维,网络中的每个节点都获得较高并且一致的分类性能,此外节点间只传输交互中间变量可以有效地保护数据的隐私。 | ||
搜索关键词: | 基于 混合 公共 因子 分析器 分布式 数据 分类 方法 | ||
【主权项】:
1.基于混合公共因子分析器的分布式高维数据分类方法,其特征在于,所述方法包括:步骤1,数据的采集;设有M个节点组成一个网络,每个节点采集到的数据来自V个类,数据维度为p;其中,节点m采集到的所有数据中,来自第v个类的数据集为
其中
表示节点m处,来自第v个类的第n个数据,
为数字第v个类的训练数据个数;此外,节点m的邻居节点集合表示为Rm;步骤2,训练:对于所有节点中来自于第v个类的数据
用混合公共因子分析器(MCFA)来描述其分布,并且采用分布式方式完成模型的训练,估计出参数
用同样的方式估计出每一类数据所对应的MCFA的参数集Θ(v)(v=1,...,V);其中
为混合权值,满足![]()
(q维矢量)和
((q×q)矩阵)分别为与p维数据对应的q维因子所服从的高斯分布的均值和协方差矩阵,q取p/2~p/8之间的任意整数,L和E矩阵中的每一个元素都从标准正态分布N(0,1)中生成;步骤3,识别:当网络中的任一节点采集到新的用于识别的数据x'时,计算x'关于Θ(v)(v=1,...,V)的对数似然值logp(x'|Θ(v))(v=1,...,V):
将最大对数似然值对应的序号作为x'的识别结果v':![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510916426.6/,转载请声明来源钻瓜专利网。