[发明专利]基于画像的代码评审者推荐方法以及代码评审者画像系统在审
申请号: | 202210177357.1 | 申请日: | 2022-02-24 |
公开(公告)号: | CN114564672A | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 张贺;翁芷洛;杨岚心;周鑫;邵栋;荣国平 | 申请(专利权)人: | 南京匡吉信息科技有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/9535;G06F16/951;G06F16/36;G06F16/901 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 210012 江苏省南京市雨花*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 画像 代码 评审 推荐 方法 以及 系统 | ||
1.一种基于画像的代码评审者推荐方法,其特征在于,所述方法包括以下步骤:
S1:根据合并请求的属性数据、历史评审数据、用户的属性数据和仓库的属性数据数据,抽取实体、属性及实体间关系,构建评审领域知识图谱;
S2:基于建立的评审知识图谱,构建包括评审者评审关系指标和评审者评审过程指标两部分在内的评审者评价指标体系;
S3:基于建立的评审知识图谱,查询包含评审者节点的知识图谱子图,计算评审者的评审关系指标和评审过程指标,建立评审者画像;
S4:当新的合并请求提交时,计算每个评审者与该合并请求的匹配程度,选择最匹配的评审者并通知。
2.根据权利要求1所述的基于画像的代码评审者推荐方法,其特征在于,在建立评审知识图谱前,还包括以下步骤:
合并请求ID、创建时间、更新时间、关闭时间、合并时间、状态、作者ID、评审者ID;
获取所有用于构建图谱的用户的属性信息,包括用户名、用户ID、用户类型;
获取所有用于构建图谱的仓库的属性信息,包括仓库名、仓库ID、所有者ID、创建时间、更新时间。
3.根据权利要求2所述的基于画像的代码评审者推荐方法,其特征在于,所述构建评审领域知识图谱前,还包括以下步骤:
处理合并请求信息中的缺失或者异常数据;
处理合并请求信息中的缺失或者异常数据包括:处理缺失值和异常值,合并请求的属性信息缺失或异常时,舍弃该条合并请求信息,不将其作为构建图谱的数据。
4.根据权利要求3所述的基于画像的代码评审者推荐方法,其特征在于,步骤1中,利用知识图谱构建方法建立评审知识图谱的具体步骤如下:
S1-1:获取数据,即从数据源中获取所需的数据;
S1-2:抽取知识,在获得数据后需要从中提取出实体、属性以及实体间的相互关系,在此基础上形成本体化的知识表达;
S1-3:将实体和关系写入数据库,构建并存储知识图谱。
5.根据权利要求3或4所述的基于画像的代码评审者推荐方法,其特征在于,步骤3具体如下:
S3-1:查询包含评审者节点的知识图谱子图,包括该评审者评审的合并请求、该评审者合并的合并请求、评审了上述合并请求的评审者、上述合并请求的作者等节点;
S3-2:使用中心度算法计算该评审者的重要性;
S3-3:查询与评审者相关的合并请求信息,包括该评审者评审的合并请求和该评审者合并的合并请求;
S3-4:根据与评审者相关的合并请求信息,计算评审者的评审过程指标。
6.根据权利要求5所述的基于画像的代码评审者推荐方法,其特征在于,步骤4具体如下:
S4-1:获取合并请求的属性信息,包括作者ID、创建时间;
S4-2:查询建立的评审知识图谱,获取该用户创建的合并请求的历史评审者集合;
S4-3:计算每个候选评审者的得分,考虑其与该用户的历史评审者的相似性、评审者的评审过程指标和评审关系指标,加权相加得到评分;
S4-4:将候选评审者按照最终评分排序,选择评分最高的一个或多个人作为评审者推荐的结果;
S4-5:若评审者响应时间过长,则顺延地将下一个人作为推荐的评审者。
7.一种基于知识图谱的评审者画像系统,其特征在于,所述系统包括数据处理模块、知识图谱构建模块、图查询模块、指标计算模块和图可视化模块;
所述数据处理模块用于提取、清洗和预处理数据;
所述知识图谱构建模块用于从数据中抽取所需实体、关系和属性,存入图数据库以构建评审知识图谱;
所述图查询模块用于进行包含特定评审者节点的子图查询,并对评审者的评审关系指标度量进行计算;
所述指标计算模块用于计算评审人员的各项评审指标,对评审人员的评审过程进行度量;
所述图可视化模块用于对数据处理模块中获取的评审者基本信息、图查询模块中获取的子图和计算的评审关系指标、指标计算模块中计算的评审过程指标进行可视化。
8.根据权利要求7所述一种基于知识图谱的评审者画像系统,其特征在于,数据处理模块包含:
数据爬取单元,负责获取合并请求的属性数据、历史评审数据、用户的属性数据和仓库的属性数据等数据;
数据清洗单元,负责处理带有空值的记录,在本实施例中删除带有空值的记录,不将其作为构建知识图谱的数据;
知识图谱构建模块包含:
数据抽取单元,负责抽取清洗后数据中的实体、属性与关系;
数据库交互单元,负责与图数据库进行交互,以构建所需的评审知识图谱。
图查询模块包含:
子社区查询单元,查询和被查询评审者同社区的评审者,返回节点与关系;
子图查询单元,查询与被查询评审者相关的合并请求、评审者节点和关系;
指标计算模块240包含:
评审过程指标计算单元,基于获取的评审者-合并请求子图,计算各项评审过程指标,并作为节点的属性存储;
评审关系指标计算单元,基于获取的评审者与相关评审者子图,计算各项评审关系指标,并作为节点的属性存储;
图可视化模块用于展示评审者的基本信息、评审者各项指标情况以及与其他评审者对比、评审者所属社区子图和相关评审者关系图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京匡吉信息科技有限公司,未经南京匡吉信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210177357.1/1.html,转载请声明来源钻瓜专利网。