[发明专利]一种多图融合方法在审
申请号: | 201911044229.4 | 申请日: | 2019-10-30 |
公开(公告)号: | CN110750689A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 张伟;赵海燕;金芝 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06N3/00 |
代理公司: | 11732 北京睿智保诚专利代理事务所(普通合伙) | 代理人: | 周新楣 |
地址: | 100000*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 信息熵 父代 种群 预处理 后继处理 随机方式 适应度 转化 | ||
本发明公开了一种多图融合方法,其通过接收一组图作为被融合图,对这组被融合图进行预处理,将其中的每一个被融合图转化为一个节点具有类型、边具有类型、边具有方向的被融合图,作为后继处理活动的输入,采用随机方式生成一组多图融合方案,作为初始父代种群,对于初始父代种群中的多图融合方案,计算多图融合方案的信息熵,多图融合方案的信息熵形成多图融合方案的适应度,对于两个待交叉的多图融合方案,选取两者之间的一条最短编辑路径上的某个点作为这两个融合方案的一个交叉结果,实现同时对多个图进行融合,并提高多图的融合质量。
技术领域
本发明涉及多图融合技术领域,尤其是涉及一种多图融合方法。
背景技术
图(Graph)数据广泛出现在各种问题领域里,例如,生物领域的蛋白质交互图、知识表示领域的知识图谱、软件开发领域的各种结构化制品、数据存储领域中基于图的数据库。对于任何有结构的信息,都可以采用图的方式进行表示。一个图包含一组节点和一组节点之间的边,节点用于表示实体型信息,边用于表示关系型信息。图融合的目标是确定不同图中具有相同或相似语义的节点,从而实现多图数据中冗余信息的消除或知识在不同图之间的迁移等。多图融合问题的本质是一个优化问题,要从一个大规模的多图融合方案空间中寻找到一个高质量的多图融合方案。
然而,现有的多图融合方法并没有真正实现对多个图的同时融合,而是把多图融合问题转化为一组两个图之间的融合问题,导致多图融合的结果与这组两图融合问题的求解顺序相关,无法提供一个高质量的多图融合方案。
发明内容
为了解决上述技术问题,本发明的目的是提供一种多图融合方法。
为解决上述技术问题,本发明采用如下技术方案:
一种多图融合方法,包括如下步骤:
S0,接收一组图作为被融合图;
S1,对一组被融合图进行预处理,将其中的每一个图转化为一个节点具有类型、边具有类型、边具有方向的被融合图,作为后继处理活动的输入;
S2,采用随机方式生成一组多图融合方案,作为父代种群的初始值;
S3,对于父代种群中的多图融合方案,计算多图融合方案的信息熵;
S4,将父代种群中每一个多图融合方案的信息熵转化为多图融合方案的适应度;
S5,检查父代种群中是否存在信息熵为零的多图融合方案,如果存在这样的多图融合方案,则返回该多图融合方案,并终止当前多图融合过程;
S6,检查当前的多图融合过程是否满足终止条件,如果满足终止条件,则返回当前父代种群中适应度最高的多图融合方案,并终止当前多图融合过程;
S7,在父代种群中,把所有多图融合方案按适应度从大到小的顺序排列,选择适应度排名靠前的若干多图融合方案,并将这些多图融合方案放入子代种群中;
S8,基于融合方案的适应度,从父代种群中确定一组待交叉的多图融合方案对;
S9,对于每一对待交叉的多图融合方案,选取两者之间的一条最短编辑路径上的某个点作为这两个融合方案的一个交叉结果,然后把这个交叉结果放入子代种群中;
S10,当所有待交叉的多图融合方案对都完成交叉后,把父代种群清空后再把子代种群中的所有多图融合方案加入父代种群中,然后把子代种群清空,然后跳转至S3。
其中,一个被融合图包含一组节点和一组存在于节点之间的边;被融合图中的一个节点可以具有类型;被融合图中的一个节点可以具有值信息,如一个数值、一组数值、一个枚举值、一组枚举值,一段文本信息等;被融合图中的一条边可以具有类型;被融合图中的一条边可以是一条有方向的边,也可以是一条无方向的边;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911044229.4/2.html,转载请声明来源钻瓜专利网。