[发明专利]一种多参数流式数据自动分群方法在审
申请号: | 201910204433.1 | 申请日: | 2019-03-18 |
公开(公告)号: | CN110197193A | 公开(公告)日: | 2019-09-03 |
发明(设计)人: | 孟晓辰;祝连庆;娄小平;董明利;于明鑫;刘锋;宋言明 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G16H50/00 |
代理公司: | 北京市科名专利代理事务所(特殊普通合伙) 11468 | 代理人: | 陈朝阳 |
地址: | 100085 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种多参数流式数据自动分群方法,包括如下步骤:步骤一:基于t‑SNE的多参数数据分群:输入待降维多参数流式数据,设定需要降到的维数d以及损失函数参数困惑度;对样本矩阵X进行初始化,计算相应矩阵之间的距离,使用固定的困惑度计算条件概率pj|i;进入循环迭代:计算低维度下的联合概率,计算梯度;迭代寻优,更新低维数据,迭代结束后得到的矩阵即为降维后的主成分参数矩阵;步骤二:将主成分参数矩阵数据使用K‑means算法聚类:随机选取个聚类质心点作为初始质心。 | ||
搜索关键词: | 多参数 矩阵 流式数据 成分参数 困惑度 低维 分群 降维 迭代结束 迭代寻优 计算条件 矩阵数据 聚类质心 数据分群 随机选取 损失函数 循环迭代 样本矩阵 初始化 固定的 概率 聚类 算法 维数 质心 更新 联合 | ||
【主权项】:
1.一种多参数流式数据自动分群方法,其特征在于,包括如下步骤:步骤一:基于t‑SNE的多参数数据分群:输入待降维多参数流式数据,设定需要降到的维数d以及损失函数参数困惑度;对样本矩阵X进行初始化,计算相应矩阵之间的距离,使用固定的困惑度计算条件概率pj|i;令联合概率分布pij=(pi|j+pj|i)/2n,随机初始化低维数据;进入循环迭代:计算低维度下的联合概率,计算梯度;迭代寻优,更新低维数据,迭代结束后得到的矩阵即为降维后的主成分参数矩阵;步骤二:将主成分参数矩阵数据使用K‑means算法聚类:随机选取K个聚类质心点作为初始质心;对于每一个样例,计算其应该属于的类,计算其到k个质心中每一个的距离,然后选取距离最近的类作为样例所述的类别;对于每一个类,重新计算该类的质心直到其不变或者变化很小,若达到迭代次数或类群质心不发生改变,结束聚类;重复上述过程直到收敛,即得出分类标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910204433.1/,转载请声明来源钻瓜专利网。