[发明专利]一种基于节点结构相似性和语义邻近性的世系图摘要方法有效
申请号: | 201911331390.X | 申请日: | 2019-12-21 |
公开(公告)号: | CN111125375B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 卢暾;周倍思;于方玉;张鹏;顾宁 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/30 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 节点 结构 相似性 语义 邻近 世系 摘要 方法 | ||
本发明属于世系要技术领域,具体为基于节点结构相似性和语义邻近性的世系图摘要方法。本发明包括两个阶段:相似节点集合标识阶段,根据节点的结构相似性和语义邻近性将相似的节点聚集在一起,标识一系列相似节点集合;节点集合替换阶段,世系图中包含多种类型节点,如数据节点、活动节点、代理节点等,针对不同类型的节点集合采用了不同的替换策略,从而保证替换后世系图的有效性;本发明结合活动节点间影响力邻近性和时间邻近性定义活动节点的语义距离,最终标识语义临近的活动节点集合。本发明方法使用超节点替换结构相似和语义相似的节点集合,提炼世系图中的相似节点,降低了世系图的结构复杂性和语义复杂性,提高了世系图的可理解程度。
技术领域
本发明属于世系图技术领域,具体涉及基于节点结构相似性和语义邻近性的世系图摘要方法。
背景技术
世系数据记录了数据衍化历史,针对某一数据世系查询可以该描述数据产生过程,以帮助结果再现、信任度增强、质量评估等。然而世系数据是随着时间不断积累的,这将世系查询的结果十分庞大。如果以世系图的形式将查询结果展现出来,该图可能包含成千上万个节点,这样的世系图是很难被读者直观地理解的。大多数现有的世系图摘要算法需要通过大量人力辅助标识相似的节点集合,如根据大量采访产生的知识库进行标识等。因此,本发明提出了一种基于节点结构相似性和语义邻近性的世系图摘要方法,该方法基于具有相同数据来源和用途的数据节点是较高语义数据的子数据、协同合作产生相同数据的活动节点是较高语义活动的子活动、较高语义活动所包含活动节点具有相似的影响力以及相近活动时间这三个认知,标识了结构相似和语义相似的节点集合。然后使用超节点替换结构相似和语义相似的节点集合,提炼了世系图中的相似节点,降低了世系图的结构复杂性和语义复杂性,提高了世系图的可理解程度。
发明内容
本发明的目的在于提供一种基于节点结构相似性和语义邻近性的世系图摘要方法,以降低了世系图的结构复杂性和语义复杂性,提高了世系图的可理解程度。
本发明提出的世系图摘要方法,是基于具有相同数据来源和用途的数据节点是较高语义数据的子数据、协同合作产生相同数据的活动节点是较高语义活动的子活动、较高语义活动所包含活动节点具有相似的影响力以及相近活动时间这三个认知而实现的。该方法包括两个阶段:相似节点集合标识阶段,根据节点的结构相似性和语义邻近性将相似的节点聚集在一起,标识一系列相似节点集合;节点集合替换阶段,世系图中包含多种类型节点,如数据节点、活动节点、代理节点等,针对不同类型的节点集合采用了不同的替换策略,从而保证替换前后世系图的有效性
(一)相似节点集合标识阶段
基本做法是基于具有相同数据来源和用途的数据节点是较高语义数据的子数据、协同合作产生相同数据的活动节点是较高语义活动的子活动、较高语义活动所包含活动节点具有相似的影响力以及相近活动时间这三个认知,先根据数据节点的来源和用途标识了相似数据节点集合,然后根据活动节点的输出数据标识了相似活动节点集合,伴随着活动节点集合的标识,它们相应关联的代理集合被标识,最后借鉴了传统聚类算法相似性距离度量的定义,结合活动节点间影响力邻近性和时间邻近性定义了活动节点的语义距离,最终标识了语义临近的活动节点集合。
在相似节点集合标识阶段将涉及到数据来源、数据用途、活动输入、活动输出、活动控制者等定义。
定义1:对于数据节点d,如果世系图中存在一个活动节点a,且存在关系WasGeneratedBy(d,a),那么活动a可以成为数据d的来源。Source(d)={a1,a2,…,an}表示数据d的所有来源,其中ai∈Source(d)是d的来源之一。
定义2:对于数据节点d,如果世系图中存在一个活动节点a,且存在关系Used(a,d),那么活动a可以成为数据d的用途。Usage(d)={a1,a2,…,an}表示数据d的所有用途,其中ai∈Usage(d)是d的用途之一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911331390.X/2.html,转载请声明来源钻瓜专利网。