[发明专利]基于LDA模型和PageRank算法建立特征接口有向图的方法有效
申请号: | 201410156746.1 | 申请日: | 2014-04-18 |
公开(公告)号: | CN103927177B | 公开(公告)日: | 2017-01-25 |
发明(设计)人: | 孙小兵;施伟;李斌;李云 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06F9/44 | 分类号: | G06F9/44 |
代理公司: | 南京苏科专利代理有限责任公司32102 | 代理人: | 董旭东 |
地址: | 225009 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了软件工程领域内的基于LDA模型和PageRank算法建立特征接口有向图的方法,包括如下步骤1)选取适当的开源软件库作为代码支持;2)通过LDA主题模型提取出项目对应的主题作为该项目的特征集合;3)检索各项目中的接口信息,与各项目对应的特征集合建立联系,构成由项目特征集合指向项目接口集合的特征‑接口有向图,利用PageRank算法计算接口在项目内部的调用次数作为特征‑接口有向图中边的权值;4)在构成特征‑接口有向图后,程序开发人员根据待开发项目的特征与所述特征‑接口有向图中的特征进行匹配,根据有向图边的指向关系推荐可能的最优接口列表供开发人员选择使用,本发明提高了软件开发的效率,可用于软件开发中。 | ||
搜索关键词: | 基于 lda 模型 pagerank 算法 建立 特征 接口 方法 | ||
【主权项】:
一种基于LDA模型和PageRank算法建立特征接口有向图的方法,其特征在于,包括如下步骤:步骤1) 选取适当的开源软件库作为代码支持;步骤2) 对选取的开源软件库中的项目,通过LDA主题模型提取出项目对应的主题作为该项目的特征集合,具体方法如下:LDA模型对开源软件库中的项目提取主题时,通过对于LDA参数设置,实现每次只提取一个项目,以该项目为一个文档库,通过LDA模型提取出该项目的主题,然后,依次对开源软件库中的其他开源项目使用同样的方法提取主题;在当前需要提取主题的项目中使用LDA模型提取主题时,将分布值最高的前两个主题作为最佳特征集合BestFi,最佳特征集合BestFi作为步骤4)中接口的匹配对象;步骤3) 检索各项目中的接口信息,与各项目对应的特征集合建立联系,构成由项目特征集合指向项目接口集合的特征‑接口有向图,利用PageRank算法计算接口在项目内部的调用次数作为特征‑接口有向图中边的权值,具体方法如下:遍历当前项目,检索出项目文件中的接口并以“文件名.接口名”的形式定位该接口,建立由最佳特征集合BestFi指向接口集合的特征‑接口有向图;特征‑接口有向图建立之后,使用PageRank算法统计项目中各接口的调用次数,同时,依据计算值大小对接口进行排序;步骤4) 在构成特征‑接口有向图后,程序开发人员根据待开发项目的特征与所述特征‑接口有向图中的特征进行匹配,根据有向图边的指向关系推荐可能的最优接口列表供开发人员选择使用,具体方法如下:当程序开发人员进行特征匹配时,将开发人员选择的待开发项目的特征集合f与最佳特征集合BestFi进行匹配,匹配方法为:将特征集合f中的每一个词依次匹配BestFi中对应的词语,当匹配成功词数占特征集合f总词数的百分比大于等于50%时,判定特征集合f与所述最佳特征集合BestFi匹配成功,并根据特征‑接口有向图中边的指向为程序开发人员推荐接口列表供程序开发人员自行选择;当程序开发人员选择某个接口之后,根据步骤3)中的定位方式确定具体的接口,并为开发人员推荐该接口。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410156746.1/,转载请声明来源钻瓜专利网。