[发明专利]基于JAVA Doc知识图谱的多维评估推荐方法有效
申请号: | 201911142972.3 | 申请日: | 2019-11-20 |
公开(公告)号: | CN110874431B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 贾力;杨明;高提雷;杨棣;解婉誉 | 申请(专利权)人: | 云南财经大学;昆明冶金高等专科学校 |
主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06F16/36;G06F16/35 |
代理公司: | 昆明金科智诚知识产权代理事务所(普通合伙) 53216 | 代理人: | 胡亚兰 |
地址: | 650221 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 java doc 知识 图谱 多维 评估 推荐 方法 | ||
1.一种基于JavaDoc知识图谱的多维评估推荐方法,其特征在于,包括以下步骤:
S1,通过对Java Doc文档的爬取以及分析建立一个Java类知识图谱;
S2,根据已经建立好的Java Doc知识图谱,通过类与外界的关系分析实体间的路径关系,建立推荐函数对数据进行挖掘,通过类和类之间的关系确定推荐的推荐域;
S3,选用基于文本的K-means聚类方法来进行类之间的聚类,将聚类结果作为基于知识图谱挖掘的推荐域的补集;
S4,基于Java语言特性的评分标准对推荐域的类进行多维量化评分;
S5,通过S4的各项评分,建立综合量化评分模型,将综合量化评分模型进行相似度量化评分,为每一个推荐域的候选项进行评分,并将推荐域中的类的量化评分返回给用户;
所述S4中的评分标准基于以下三个维度:
1)通过Page Rank算法进行衡量类和接口的关系;
针对PageRank算法,通过该算法计算出图谱中所有接口的PR值,在JAVA中,一个类实现了哪些接口也是作为确定该类功能的一个重要依据,通过分析每个类所实现的接口来对类进行一个相似度的分析,使用每个接口的逆PR值来对类进行评价,对推荐域中的类所实现接口和输入类所实现的接口做交集运算,再以相交的接口为依据对类进行评分;
2)类和类在知识图谱中的亲密中心性;
3)类在知识图谱中的中介中心性;
其中,
亲密中心性是指,某一个节点,到达图中所有其他节点距离的平均值,通过对比两个类在图中的相对中心性距离来衡量两个类间的物理距离,通过对距离进行量化,来从图中相对位置对类进行比较;相对距离越近,代表两个类越相似;
中介中心性是指,图中任意两点间的所有通路中,经过某个节点的次数,如果次数越多代表中介中心性就越高。
2.根据权利要求1所述的一种基于Java Doc知识图谱的多维评估推荐方法,其特征在于,所述S1中建立一个Java类知识图谱包括以下步骤:
S11,数据的抽取:采用Python 中的Beautiful Soup工具包爬取格式文件为html的JavaDoc中的数据;具体地,通过对头部标签、实现接口标签和直接子类标签进行爬取获得内部数据;
S12,数据规范化:对爬取的数据进行筛选操作;具体地,通过对获取项目进行简单的筛选,选出项目属性至少一项不为空的项目作为实验使用的数据集;
S13,建立RDF模型:分析数据,并建立数据的RDF模型,将数据转换为RDF存入图数据库,采用Neo4j作为数据的存储介质;
S14,数据可视化:将数据存入数据库后进行知识图谱的可视化工作;具体地,在进行数据导入过程中使用了py2neo的工具包进行数据库和程序的链接以及数据库操作,将数据以RDF的形式存入到Neo4j数据库系统中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南财经大学;昆明冶金高等专科学校,未经云南财经大学;昆明冶金高等专科学校许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911142972.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息查询方法及其相关设备
- 下一篇:一种新型带状线到同轴垂直转换结构