[发明专利]一种众包软件开发者推荐方法有效
申请号: | 201711013436.4 | 申请日: | 2017-10-26 |
公开(公告)号: | CN107767058B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 孙海龙;王旭;符阳;夏正林 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 软件 开发者 推荐 方法 | ||
1.一种众包软件开发者推荐方法,其特征在于,步骤1,对数据集进行预处理,选取信息完善的任务,并提取选取的任务特征信息构造任务的特征向量;步骤2,采用K-means聚类算法对任务进行聚类,将相似的任务聚集一起;步骤3,对于新的众包任务同样提取任务的特征,得到与之前的任务相似的聚类任务;步骤4,在相似的任务间通过分类得到获胜率较高的开发者作为初步推荐的开发者候选集;步骤5,在开发者候选集中得到可靠性高的开发者,并剔除可靠性较低的开发者,并根据开发者参与历史任务情况分析开发者之间的关联关系,建立开发者竞争网络;
所选取的任务特征信息包括任务标题、任务需求描述、开发语言、所需技能、框架、运行平台、开发周期、任务的奖金,所述标题和需求是自然语言文本描述,语言、技能、框架是固定的集合,周期,奖金是数值信息;对任务特征信息进行数字化处理,采用了分词技术处理标题和需求描述信息,去除停用词,包括the、a、an、标点,然后使用公式得到每个词的权重,其中x,s为自然数;对于任务开发周期、奖金数值信息,采用公式进行处理将数值归一化到[0,1]区间;
将推荐的开发者按照其获胜概率进行排序,针对每一个开发者由其参与任务数ri,提交任务数si,以及获胜任务数wi,根据公式分别得到开发者候选集中开发者的平均提交率和获胜率,过滤掉低于所述平均提交率和平均获胜率的开发者,其中n为开发者的个数,i为开发者的序号;
在所述步骤5中,基于内容推荐的开发者候选集,建立从参与者到获胜者的有向边,设置edge(di,dj)表示开发者dj和di竞争中dj的获胜次数,deg(di)表示开发者di参与任务数,开发者di,dj之间的吸引力公式为其中分子表示了开发者dj相对di的获胜次数,分母表示di,dj参与任务的总数目,attraction(di,dj)越大,一方面表明dj相对di获胜次数多,能力水平更强,另一方面也表明dj,di共同参与的任务数多;对每一个开发者di,获取k个吸引力最大的开发者attracter(di)的方法为所述i,j为自然数。
2.如权利要求1所述的方法,其特征在于,在所述步骤4中,对相似的任务进行分类时,首先分析任务的需求描述,然后构建任务的特征向量,最后使用机器学习分类器进行推荐。
3.如权利要求1所述的方法,其特征在于,还包括,在所述步骤2和所述步骤3进行聚类时,选取时间作为影响因素按照公式处理得到聚类距离,所述ta,tb表示两个不同任务a和b,N表示技能集合的总数量,xa,K表示任务a是否需要第K个技能,若需要为1,否则为0,所述datea表示任务a的发布时间,所述m为常数。
4.如权利要求1所述的方法,其特征在于,所述构建的特征向量包含三个部分,第一部分是文本信息,所述文本信息包括标题、需求描述,第二部分是技能信息,所述技能信息包括开发语言、框架、平台,第三部分是数值信息周期、奖金。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711013436.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理