[发明专利]一种众包软件开发者推荐方法有效

专利信息
申请号: 201711013436.4 申请日: 2017-10-26
公开(公告)号: CN107767058B 公开(公告)日: 2021-03-19
发明(设计)人: 孙海龙;王旭;符阳;夏正林 申请(专利权)人: 北京航空航天大学
主分类号: G06Q10/06 分类号: G06Q10/06;G06K9/62
代理公司: 北京中创阳光知识产权代理有限责任公司 11003 代理人: 尹振启
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 软件 开发者 推荐 方法
【权利要求书】:

1.一种众包软件开发者推荐方法,其特征在于,步骤1,对数据集进行预处理,选取信息完善的任务,并提取选取的任务特征信息构造任务的特征向量;步骤2,采用K-means聚类算法对任务进行聚类,将相似的任务聚集一起;步骤3,对于新的众包任务同样提取任务的特征,得到与之前的任务相似的聚类任务;步骤4,在相似的任务间通过分类得到获胜率较高的开发者作为初步推荐的开发者候选集;步骤5,在开发者候选集中得到可靠性高的开发者,并剔除可靠性较低的开发者,并根据开发者参与历史任务情况分析开发者之间的关联关系,建立开发者竞争网络;

所选取的任务特征信息包括任务标题、任务需求描述、开发语言、所需技能、框架、运行平台、开发周期、任务的奖金,所述标题和需求是自然语言文本描述,语言、技能、框架是固定的集合,周期,奖金是数值信息;对任务特征信息进行数字化处理,采用了分词技术处理标题和需求描述信息,去除停用词,包括the、a、an、标点,然后使用公式得到每个词的权重,其中x,s为自然数;对于任务开发周期、奖金数值信息,采用公式进行处理将数值归一化到[0,1]区间;

将推荐的开发者按照其获胜概率进行排序,针对每一个开发者由其参与任务数ri,提交任务数si,以及获胜任务数wi,根据公式分别得到开发者候选集中开发者的平均提交率和获胜率,过滤掉低于所述平均提交率和平均获胜率的开发者,其中n为开发者的个数,i为开发者的序号;

在所述步骤5中,基于内容推荐的开发者候选集,建立从参与者到获胜者的有向边,设置edge(di,dj)表示开发者dj和di竞争中dj的获胜次数,deg(di)表示开发者di参与任务数,开发者di,dj之间的吸引力公式为其中分子表示了开发者dj相对di的获胜次数,分母表示di,dj参与任务的总数目,attraction(di,dj)越大,一方面表明dj相对di获胜次数多,能力水平更强,另一方面也表明dj,di共同参与的任务数多;对每一个开发者di,获取k个吸引力最大的开发者attracter(di)的方法为所述i,j为自然数。

2.如权利要求1所述的方法,其特征在于,在所述步骤4中,对相似的任务进行分类时,首先分析任务的需求描述,然后构建任务的特征向量,最后使用机器学习分类器进行推荐。

3.如权利要求1所述的方法,其特征在于,还包括,在所述步骤2和所述步骤3进行聚类时,选取时间作为影响因素按照公式处理得到聚类距离,所述ta,tb表示两个不同任务a和b,N表示技能集合的总数量,xa,K表示任务a是否需要第K个技能,若需要为1,否则为0,所述datea表示任务a的发布时间,所述m为常数。

4.如权利要求1所述的方法,其特征在于,所述构建的特征向量包含三个部分,第一部分是文本信息,所述文本信息包括标题、需求描述,第二部分是技能信息,所述技能信息包括开发语言、框架、平台,第三部分是数值信息周期、奖金。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711013436.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top