[发明专利]一种基于节点结构相似性和语义邻近性的世系图摘要方法有效
申请号: | 201911331390.X | 申请日: | 2019-12-21 |
公开(公告)号: | CN111125375B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 卢暾;周倍思;于方玉;张鹏;顾宁 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/30 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 节点 结构 相似性 语义 邻近 世系 摘要 方法 | ||
1.一种基于节点结构相似性和语义邻近性的世系图摘要方法,其特征在于,分为两个阶段:相似节点集合标识阶段,根据节点的结构相似性和语义邻近性将相似的节点聚集在一起,标识一系列相似节点集合;节点集合替换阶段,世系图中包有多种类型节点,包括数据节点、活动节点、代理节点;针对不同类型的节点集合采用不同的替换策略,从而保证替换后世系图的有效性;其中:
(一)相似节点集合标识阶段
具有相同数据来源和用途的数据节点是较高语义数据的子数据,协同合作产生相同数据的活动节点是较高语义活动的子活动,较高语义活动所包含活动节点具有相似的影响力以及相近活动时间,基于这三个认知,寻找相似节点,具体步骤为:
步骤1:根据数据节点的来源和用途标识相似数据节点集合,数据节点的来源是指产生数据的活动节点,数据节点的用途是指使用数据作为输入的活动节点;
Initial DCu={di}
if Source(di)=Source(dj)and Usage(di)=Usage(dj)
then DCk=DCk∪{dj} (公式1)
其中,di和dj表示世系图中的任意两个数据节点,DCk表示数据节点的集合,Source()将求出给定数据的来源,Usage()将求出给定数据的用途;
步骤2:根据活动节点的输出数据标识相似活动节点集合,伴随着活动节点集合的标识,它们相应关联的代理集合被标识为;
InitialACk={ai},CCk={controller(ai)}
if output(ai)=output(aj)
then ACk=ACk∪{aj},CCk=CCk∪{controller(aj)} (公式2)
其中,ai和aj表示世系图中的任意两个活动节点,ACk表示活动节点的集合,CCk表示代理节点的集合,controller()将返回给定活动的控制者,output()将求出给定活动的输出数据;
步骤3:结合活动节点间影响力邻近性和时间邻近性定义活动节点的语义距离,标识语义临近的活动节点集合及其相应的代理节点集合为;
influence(ai)=(∑d∈DataExist(out_edge(d,ai))-Imin)/(Imax-Imin) (公式3)
influence_distance(ai,aj)=|influence(ai)-influence(aj)| (公式4)
time_distance(ai,aj)=max(0,ai·startTime-aj·endTime,aj·startTime-ai·endTime) (公式5)
semantic_distance(ai,aj)=influence_distance(ai,aj)+time_distance(ai,aj)(公式6)
Initial SACk={ai},SCCk={controller(ai)}
if semantic_distance(ai,aj)<σ
then SACk=SACk∪{ai},SCCk=SCCk∪{controller(aj)} (公式7)
其中,ai和aj表示世系图中的任意两个活动节点,Data表示世系图中的所有数据节点的全集,当世系图中存在从d到ai的边时,Exist(out_edge(d,ai))=1,否则结果为0;Imin表示所有活动节点影响力的最小值,Imax表示所有活动节点影响力的最大值,ai.startTime、aj.startTime、ai.endTime和aj.endTime分别表示活动ai,aj的开始时间和结束时间,SACk表示待替换的活动节点的集合,SCCk表示待替换的代理节点的集合,σ是由用户给出的语义聚类门槛;
(二)节点集合替换阶段
世系图中含有多种类型节点,包括数据节点、活动节点、代理节点,针对不同类型的节点集合采用不同的替换策略,从而保证替换前后世系图的有效性;具体步骤为:
步骤1:替换数据节点的集合DCk,具体流程为:
(1)创建并初始化数据节点d,以数据节点d替换DCk;
(2)在世系图中为数据节点d创建WasGeneratedBy关系;
(3)在世系图中为数据节点d创建Used关系;
步骤2:替换活动节点的集合ACk及其相应的代理节点的集合CCk,具体流程为:
(1)创建并初始化活动节点a,以活动节点a替换ACk;
(2)在世系图中为活动节点a创建WasGeneratedBy关系;
(3)在世系图中为活动节点a创建Used关系;
(4)创建并初始化代理节点c,以代理节点c替换CCk;
(5)在世系图中为创建从活动节点a到代理节点c的WasControlledBy关系;
create WasControlledBy from a to c (公式15)
步骤3:替换待替换的活动节点集合SACk及其相应的待替换的代理节点集合SCCk,具体流程为:
(1)寻找由活动集合SACk产生并使用的中间数据节点;
INTD=INTD1∪INTD2 (公式16)
(2)创建并初始化活动节点a,以活动节点a替换SACk∪INTD;
(3)在世系图中为活动节点a创建WasGeneratedBy关系;
(4)在世系图中为活动节点a创建Used关系;
(5)与步骤2中一致,创建并初始化代理节点c,以代理节点c替换SCCk,并创建从活动节点a到代理节点c的WasControlledBy关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911331390.X/1.html,转载请声明来源钻瓜专利网。