[发明专利]一种面向非连通图的Top-K相似匹配方法在审
申请号: | 201811580358.0 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109634967A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 高建良;熊帆;高俊;应晓婷 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 长沙正奇专利事务所有限责任公司 43113 | 代理人: | 马强;王娟 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 非连通 目标图 匹配图 相似度 相似匹配 相似度计算 标签信息 迭代计算 定量计算 连通子图 邻居节点 属性标签 图集合 迭代 加权 连通 集合 赋予 | ||
本发明公开了一种面向非连通图的Top‑K相似匹配方法,包括以下步骤:(1)给定目标图与待匹配图集合,获取所有图的连通子图集,并根据度信息为每个节点赋予初始属性标签;(2)对目标图与每个待匹配图逐一进行相似度计算:通过迭代计算两图的连通子图间相似度分值,加权获得目标图与待匹配图的相似度分值;(3)从图集合中选取与目标图的相似度分值最高的前K个待匹配图。本发明通过迭代获取邻居节点的标签信息,准确的对非连通图进行相似度的定量计算,从而解决了非连通图的Top‑K相似匹配问题。
技术领域
本发明属于图数据挖掘领域,涉及图结构分析和图匹配等方面,尤其涉及一种面向非连通图的Top-K相似匹配方法。
背景技术
随着大数据时代的到来,信息呈现爆发式增长趋势,越来越多的数据呈现出结构化强、数据间关系复杂等新特点,这给数据挖掘领域带来了新的挑战。如今,数据挖掘已经应用于生物信息学、社交网络分析和链接预测等诸多领域,大量的数据以图的形式保存,这种数据结构类型可以清晰描述事物以及事物之间的相互关系,例如在社交网络分析领域,可以用图来描述人们的社交关系行为,图中的节点表示人物实体,图中的边表示人物之间的社会联系;在生物信息学领域,可以用蛋白质相互作用图表示PPI网络,蛋白质作为图中的节点,而图中的边则代表两个蛋白质之间的相互作用。
图的相似性分析是数据挖掘领域的一个重要内容,它是许多分类思想、搜索算法以及匹配策略的基础依据,在图数据功能预测方面具有很好的应用前景,例如可以通过对未知蛋白质网络与已知蛋白质网络的相似性分析预测未知蛋白质网络的功能。该方法的难点是定量描述图的相似性以及分析算法的通用性两个方面。在图的相似性分析计算中,最核心的思想是把图的相似性映射到图中属性相同节点间的匹配程度上,匹配程度与属性数据处理分别体现了定量描述与通用性这两个难点。
Weisfeiler-Lehman标签策略是目前处理属性数据的一种常用方法,该方法的核心思想是图中的一个节点属性信息通过不断地从邻居节点获取其属性信息,用以扩大信息的表述范围,同时融入图的结构关系属性,从而不断增强信息内容质量。虽然这种方法能够很好地对节点属性信息进行增强表述,但是它只是对节点属性的一个加强分类,并没有在属性相似度上对这一增强具体表现。另外,节点经过多次获取的邻居属性信息,可以代表与其相距多跳的邻居信息,节点相距跳数不同,那么节点所包含的信息范围也就不同。
Jaccard相似性是分析图匹配程度的常用计算方法,该方法的核心思想是把图的相似性映射到节点的属性信息交集元素个数与节点的属性信息并集元素个数的占比上,以这种0到1之间的比例值来定量描述图节点的相似性(Protein complex similarity basedon Weisfeiler-Lehman labelin,Bianca K.StocKer,Till Schafer,et al)。虽然这种方法可以对连通图的相似性进行很好的定量描述,但是对于非连通图而言,该方法并不适用,例如,一个连通图包含六个节点组成的环,另一个非连通图包含两个由三个节点组成的环,以度信息为节点属性,它们Jaccard相似性却为1。
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种面向非连通图的Top-K相似匹配方法,准确高效地对非连通图相似性进行定量描述。
为解决上述技术问题,本发明所采用的技术方案是:一种一种面向非连通图的Top-K相似匹配方法,包括以下步骤:
1)给定目标图Gp和待匹配的图集合获取目标图 Gp与图集合中每个待匹配图Gi的连通子图集,并为每个连通子图中节点赋予初始属性标签;其中,i∈{1,2,...,n};
2)计算目标图Gp与图集合中待匹配图Gi连通子图间的相似度分值,加权计算Gp与Gi的相似度分值sim(Gp,Gi);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811580358.0/2.html,转载请声明来源钻瓜专利网。