[发明专利]一种基于图挖掘的软件函数变更预测系统及方法有效

专利信息
申请号: 201611122377.X 申请日: 2016-12-08
公开(公告)号: CN106648636B 公开(公告)日: 2020-01-03
发明(设计)人: 王雷;王新晨;李涵 申请(专利权)人: 北京航空航天大学
主分类号: G06F8/71 分类号: G06F8/71
代理公司: 11251 北京科迪生专利代理有限责任公司 代理人: 杨学明;顾炜
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 挖掘 软件 函数 变更 预测 系统 方法
【说明书】:

发明为一种基于图挖掘的软件函数变更预测系统及方法,属于软件工程领域。本发明基于软件网络函数调用关系图进行计算,首先需要获取整个函数调用关系图,通过对相邻版本的函数进行比较获得修改、删除、新增的函数,并得到变更函数子图,利用图挖掘算法gspan,选择参数,主要是跨度和支持度,得到相应的频繁子图,子图所包含的函数就是预测的可能发生变更的函数。

技术领域

本发明涉及一种基于图挖掘的软件函数变更预测系统及方法,属于复杂网络和数据分析及软件工程领域。

背景技术

复杂网络经常伴随着信息、病毒、疾病等的传播,而一个网络的拓扑结构对于变更传播的程度有着显著的影响。在计算机科学领域,大型软件系统中的类图、依赖图、关系图、软件组件图、函数调用图都属于复杂网络。

当开发者为了加入一个新功能或者修复一个BUG的时,对软件系统一个部分作出修改后,其他的部分为了适应修改,常常也需要进行更新。量化一个软件网络的传播性有助于节省软件维护产生的开销。

在函数调用关系图中,变更传播通常都是单方向的,函数A调用函数B,当B发生修改时,A因为接口需要作出调整因此很可能需要相应作出修改,这叫B传播到A,但当A发生修改时,B一般就不需要作出修改了。

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这些数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本、图形、图像数据,甚至是分布在网络上的异构型数据。针对半结构化数据的研究已经成为近年来国内外数据挖掘领域的研究热点,而目前国内的研究热点主要集中在文本数据挖掘等领域,针对图的数据挖掘研究才刚刚开始。与一般的数据比较,图能够表达更加丰富的语义,在科学研究和许多商业领域有着更为广泛的应用。同时,这种丰富的语义也增加了数据结构的复杂性和挖掘令人感兴趣的图的子结构的难度。因此,需要综合应用图论知识与数据挖掘的各种技术。图的数据挖掘主要是从图的数据库中找到大于最小支持度的频繁子图。

基于贪心策略的频繁子图挖掘是频繁子图挖掘领域最先发展起来的技术之一,其中最著名的是SUBDUE算法。SUBDUE算法基于最小描述长度原则(minimum descriptionlength,MDL)来发现子结构。严格来说,其所谓的频繁与之后我们介绍的频繁子图的概念有所不同。其所指的某个子结构“频繁”是用MDL原则评定的,而不是单纯指其出现的频率高。

对于许多挖掘和学习问题来说,描述关系通常比描述属性更能得出简洁且精确的规则。与之相对应的,一阶谓词逻辑在很多情况下的表现也优于命题逻辑。而且,图可以比较容易的使用一阶逻辑来表示。对基于ILP的方法而言,其优点不局限于发现知识,还可以在知识归纳中运用正反例。或者说,其目标是归纳出一个可正确分类的正样本集和负样本集的规则集。是故,归纳逻辑编程(Inductive Logic Programming,ILP)被提出而应用在频繁子图的搜索上。其优点在于大多算法能找出出现频率高的子图,且能作为交好的类识别器。但其缺点在于不能保证发现所有的频繁子图。1998年Dehaspe基于ILP提出可对频繁子图进行完全挖掘的WARMR算法,其算法核心思想与Apriori算法类似。

比较遗憾的是,基于ILP的算法由于需要图结构对一些特别的特征和谓词实例进行预特征化,故仅能发现有限特征的子结构,无法发现所有的频繁子图。而且虽然其在后续发展中结合了分层搜索以最小化对数据库的访问,效率有了极大的提升,但是,其搜索所需空间仍就很大。由此A.Inokuchi等人最先提出了基于Apriori思想的频繁子结构挖掘算法。(AGM算法)

FSG是AGM算法的一种改进。同基于Apriori的方法一样,其采用了分级扩展的方法。但优化之处在于:其采用了相对稀疏的图表示方法,来最小化存储空间和计算开销。每次添加一条边来扩大频繁子图的大小,由此使得生成候选集更有效。采用了对小图更有效的规范标签和图同构算法。其对生成候选集进行了各种优化并统计了能适用于大规模的图数据库的优化措施。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611122377.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top