[发明专利]一种多参数流式数据自动分群方法在审

申请号：	201910204433.1	申请日：	2019-03-18
公开（公告）号：	CN110197193A	公开（公告）日：	2019-09-03
发明（设计）人：	孟晓辰;祝连庆;娄小平;董明利;于明鑫;刘锋;宋言明	申请（专利权）人：	北京信息科技大学
主分类号：	G06K9/62	分类号：	G06K9/62;G16H50/00
代理公司：	北京市科名专利代理事务所(特殊普通合伙) 11468	代理人：	陈朝阳
地址：	100085 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种多参数流式数据自动分群方法，包括如下步骤：步骤一:基于t‑SNE的多参数数据分群：输入待降维多参数流式数据，设定需要降到的维数d以及损失函数参数困惑度；对样本矩阵X进行初始化，计算相应矩阵之间的距离，使用固定的困惑度计算条件概率p_j\|i；进入循环迭代：计算低维度下的联合概率，计算梯度;迭代寻优，更新低维数据，迭代结束后得到的矩阵即为降维后的主成分参数矩阵；步骤二：将主成分参数矩阵数据使用K‑means算法聚类：随机选取个聚类质心点作为初始质心。
搜索关键词：	多参数矩阵流式数据成分参数困惑度低维分群降维迭代结束迭代寻优计算条件矩阵数据聚类质心数据分群随机选取损失函数循环迭代样本矩阵初始化固定的概率聚类算法维数质心更新联合
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种多参数流式数据自动分群方法，其特征在于，包括如下步骤：步骤一:基于t‑SNE的多参数数据分群：输入待降维多参数流式数据，设定需要降到的维数d以及损失函数参数困惑度；对样本矩阵X进行初始化，计算相应矩阵之间的距离，使用固定的困惑度计算条件概率p_j|i；令联合概率分布pij＝(p_i|j+p_j|i)/2n，随机初始化低维数据；进入循环迭代：计算低维度下的联合概率，计算梯度；迭代寻优，更新低维数据，迭代结束后得到的矩阵即为降维后的主成分参数矩阵；步骤二：将主成分参数矩阵数据使用K‑means算法聚类：随机选取K个聚类质心点作为初始质心；对于每一个样例，计算其应该属于的类，计算其到k个质心中每一个的距离，然后选取距离最近的类作为样例所述的类别；对于每一个类，重新计算该类的质心直到其不变或者变化很小，若达到迭代次数或类群质心不发生改变，结束聚类；重复上述过程直到收敛，即得出分类标签。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京信息科技大学，未经北京信息科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910204433.1/，转载请声明来源钻瓜专利网。

上一篇：自然语言处理、查询构建和分类
下一篇：一种基于改进随机森林的轴承故障诊断方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多参数流式数据自动分群方法在审

专利文献下载