[发明专利]基于滤波的图聚类方法在审
申请号: | 202011203007.5 | 申请日: | 2020-11-02 |
公开(公告)号: | CN112270364A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 康昭;刘展宇;林治平;田玲;罗光春 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T5/00;G06N20/00 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 滤波 图聚类 方法 | ||
本发明提出了一种基于滤波的图聚类方法,首先使用一个低通滤波器来对原始数据特征进行一个滤波操作,然后基于子空间聚类模型进行了优化目标函数的改进,使其同时挖掘图的结构信息和特征信息,计算出亲和矩阵,最终将亲和矩阵对称化,并通过谱聚类得到图聚类结果。本发明十分通用,基于滤波技术,提出了一种简洁高效的图聚类算法模型,相较于基于深度学习的方法,本发明避免了大量参数的计算过程。本发明在多个广泛运用的数据集上相较于现存的方法展现了巨大的优势。
技术领域
本发明属于属性图聚类领域,尤其涉及一种基于滤波的图聚类方法。
背景技术
图聚类是机器学习,数据挖掘和模式识别中的一个长期存在的问题,它具有无数的应用场景,如社群分析,蛋白质结构分析等。图聚类的输入数据一般是属性图,而输出结果是每个结点的类别。属性图由每个结点自身特征,和结点与结点之间的边集构成,是非欧几里德结构数据(Non-Euclidean Structure Data)的一种很好的表示方法。由于图聚类是一个无监督学习任务,所以想要在数据上达到很好的效果十分困难。它的性能很容易受到许多因素的影响,例如聚类方法、数据噪声等。各种图聚类技术,比如K均值和谱聚类特别流行。然而,如K均值这样的方法,只会挖掘图的特征信息,而一些其他的方法只会挖掘图的结构信息。信息的不完全挖掘,使这些方法的图聚类结果不理想。
而对于大多数基于谱聚类的图聚类的方法,它们一般都会构造出图结点之间的相似度矩阵,然后将其作为谱聚类的输入,最终得到聚类结果。然而,构造相似度矩阵是一个困难的任务。研究表明,启发式构造相似度矩阵的方法可能无法完全反映结点之间相似度关系,从而导致谱聚类结果不优。所以,本发明从数据中去学习结点之间的相似度,从而能让学习到的相似度矩阵更能反映结点之间的关系。而本发明构造相似度的方法,是子空间聚类。而原本的子空间聚类方法并没有完全考虑数据的特点。一般来说,数据中都存在噪声,会对聚类结果造成很大的影响。同时原本的子空间聚类方法只挖掘了图的特征信息,并没有考虑图的结构信息,没有完全挖掘图的已知信息。
所以,考虑到上面的问题,本文提出了一个基于滤波的图聚类方法。本发明提出了一个对图结点特征的低通滤波方法,从而得到了更加光滑的表示。同时,本发明提出了一个新的优化目标函数,从而让子空间聚类能够完全挖掘图的结构信息和特征信息,让聚类结果有了较大提升。
发明内容
本发明提出了一种基于滤波的图聚类方法,该方法包括以下步骤:
步骤1:给定一个无向图其中表示结点,代表了无向图中的结点数,X=[x1,…,xn]T为图结点的特征向量,A表示了结点之间的联系,即邻接矩阵,其中,aij=aji≥0,结点的度vi被定义为:并且D=diag(d1,…,dn),相应的对称归一化图拉普拉斯矩阵可以定义为:
步骤2:对称归一化图拉普拉斯矩阵进行特征值分解为Ls=UΛU-1,相应的特征值按照递增序列表示为:Λ=diag(λ1,…,λn),对应的正交特征向量集为U=[u1,…,un],Ls的正交特征向量集被认为是图的傅里叶基,λi,i=1,2,,...,n为相应频率,让成为图结点上的实值函数,一个图信号f=[f(v1),f(v2),...,f(vn)]T就可以表示为如下所示的特征向量的线性组合:
其中,c=[c1,c2,...,cn]T是系数向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011203007.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于图片识别的商品搜索方法、装置及计算机设备
- 下一篇:一种陶瓷粉体筛分装置