[发明专利]基于拓扑特征的图拓扑结构的相似度计算方法在审
申请号: | 201910571716.X | 申请日: | 2019-06-28 |
公开(公告)号: | CN110334758A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 姚全珠;武翱;费蓉;崔颖安;赵佳瑜;李莎莎 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 王蕊转 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 向量 拓扑特征 相似度 顶点特征 构建 全局特征向量 图拓扑结构 相似度计算 距离度量 全局拓扑 特征向量 求和 加权 相似度度量 数值特征 问题计算 定义图 转化 全局 | ||
本发明公开了一种基于拓扑特征的图拓扑结构的相似度计算方法,首先定义图Ga和图Gb由不同数量的顶点和边所构成,从图Ga和图Gb中提取图的全局拓扑特征,采用特征向量构建方法构建全局拓扑特征向量,然后使用向量的距离度量方法,得到全局特征向量的距离值;从图Ga和图Gb中提取图的顶点拓扑特征,采用特征值分布的数值特征构建顶点特征向量,然后使用向量的距离度量方法,得到顶点特征向量的距离值;通过距离与相似度转化公式,将全局特征向量的距离值与顶点特征向量的距离值转化为全局和顶点拓扑特征相似度,最终使用加权求和的方法对两种相似度进行加权求和,得到图相似度,本发明解决了现有技术中存在的相似度度量问题计算成本过高的问题。
技术领域
本发明属于大规模图相似度量技术领域,具体涉及一种基于拓扑特征的图拓扑结构的相似度计算方法。
背景技术
随着科学技术的发展,生物、化学、互联网和交通运输等领域产生图数据的规模呈爆炸式增长。对大规模的图数据进行有效地分析和挖掘,并获取所蕴含的重要信息是非常有意义的研究方向。其中,如何比较图的相似度是图研究领域中重要的研究分支。两图之间相似度的准确有效度量对时序图的演化,万维网的异常检测及生物网络的比较等应用领域研究具有显着影响。若所需度量相似度的图包含数百万顶点和边,相似度度量问题的计算成本会大幅增加。如何在严格比较图中拓扑结构相似度的同时,降低计算成本成为大规模图相似度研究的关键。
发明内容
本发明的目的是提供一种基于拓扑特征的图拓扑结构的相似度计算方法,解决了现有技术中存在的相似度度量问题计算成本过高的问题。
本发明所采用的技术方案是,基于拓扑特征的图拓扑结构的相似度计算方法,具体按照以下步骤实施:
步骤1、定义图Ga和图Gb由不同数量的顶点和边所构成,从图Ga和图Gb中提取图的全局拓扑特征,采用特征向量构建方法构建全局拓扑特征的向量表示,然后使用特征向量的距离度量方法,得到全局拓扑特征向量的距离值;
步骤2:从图Ga和图Gb中提取图的顶点拓扑特征,采用变量分布的数值特征构建顶点拓扑特征的向量表示,然后使用特征向量的距离度量方法,得到顶点拓扑特征向量的距离值;
步骤3:通过距离与相似度转化公式,将步骤1得到的全局拓扑特征向量的距离值转化为全局拓扑特征相似度,将步骤2得到的顶点拓扑特征向量的距离值转化为顶点拓扑特征相似度,最终使用加权求和的方法对全局拓扑特征相似度和顶点拓扑特征相似度进行加权求和,得到图Ga和图Gb的拓扑特征相似度。
本发明的特点还在于,
步骤1具体按照以下步骤实施:
步骤1.1、提取全局拓扑特征包括顶点数V、边数E、度相关系数A、全局聚类系数GC、连通组件总数CO、密度S共6种;
步骤1.2:采用顶点数、边数、度相关系数、全局聚类系数、连通组件总数、密度的固定顺序进行特征向量构建,特征向量为[V,E,A,GC,CO,S];
步骤1.3:采用兰氏距离计算方法度量步骤1.2所得特征向量的距离,得到全局特征向量的距离值。
步骤2具体按照以下步骤实施:
步骤2.1、提取顶点拓扑特征包括度、局部聚类系数、特征中心度、网页排名、平均最近邻度共5种;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910571716.X/2.html,转载请声明来源钻瓜专利网。