[发明专利]一种众包软件开发者推荐方法有效
申请号: | 201711013436.4 | 申请日: | 2017-10-26 |
公开(公告)号: | CN107767058B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 孙海龙;王旭;符阳;夏正林 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 软件 开发者 推荐 方法 | ||
本发明的一种众包软件开发者推荐方法。首先,该算法对数据集进行预处理,选取信息较为完善的任务,并进一步提取选取的任务特征信息(如任务开发时间、报酬、需求描述、所需技能、发布时间、发布平台等)构造任务的特征向量;然后对任务进行聚类,将相似的任务聚集一起;然后,对于新的众包任务同样提取任务的特征,并得出与之相似的聚类任务,进一步在相似的任务间通过机器学习分类算法将获胜率高的开发者作为初步推荐的开发者候选集;最后,在开发者候选集中计算开发者的可靠性,并剔除部分可靠性低的开发者,根据开发者参与历史任务情况分析开发者之间的关联关系,建立开发者竞争网络。
技术领域
本发明涉及一种系统推荐方法,尤其涉及一种众包软件开发者推荐方法。
背景技术
众包这种创新模式被广泛应用于传统的各个行业,软件开发也毫不例外。众包与软件工程的结合给传统的软件开发带来新的机遇,越来越多的软件开发任务在众包平台发布、完成。众包软件开发是把企业内部由员工执行的开发任务,以自由自愿形式发布于大众网络中,个体间往往以竞争或竞价的形式完成开发任务。众包软件开发相比传统的企业内部开发有众多的优势,其中主要的特点有:①低成本:节省了长期雇佣程序员的开销,充分利用互联网上开发者群体资源,极大降低了软件开发的成本②短周期:充分利用分布在不同地理、时区的开发者,并行完成任务,加快软件开发速度,③高创新:充分利用群体智慧,汇聚群体的新颖想法,有较高的创新性。随着众包软件开发的发展,国内外存在着众多的商业软件开发平台,其中有包含完整软件开发流程的Topcoder、Upwork平台,小型任务发布平台AMT,软件测试平台Utest,以及国内的百度数据众包、阿里众包、腾讯众测等。
众包软件开发在带来低成本、快速、创新等优势的同时,也存在众多的问题,其中最主要的是项目质量控制问题。众包软件开发中任务提交来源于互联网上众多的开发者,但开发者的可靠性、能力、兴趣信息都无法直接获取。以Topcoder为例,在2006~2016时间段内约有87.4%(47万次任务参与中有41万次缺少交付)的任务注册缺少交付,35.4%(6万次提交中有2.1万质量不达标)的代码质量不达标,12%(2.7万个任务中有3200个任务失败)任务由于无可靠交付被取消。因而针对不同的任务,为其推荐能力信息匹配的开发者至关重要。所以需要对任务进行分析,考虑任务之间的不同特点,并根据开发者完成任务情况分析开发者能力信息,最后为任务推荐能力较匹配的开发者。
复杂网络关系是现实世界中复杂系统的一种抽象表现形式,网络中的节点是复杂系统中的个体,节点之间的边则是系统中个体之间按照某种规则而自然形成或人为构造的一种关系。复杂网络聚类方法的研究对分析复杂网络的拓扑结构、理解复杂网络的功能、发现复杂网络中的隐藏规律以及预测复杂网络的行为不仅具有十分重要的理论意义,而且已成为解决图论、复杂网络、数据挖掘中问题的常用方法。
在众包软件开发中,大多数的众包平台基于竞争的模式。开发者之间由于存在竞争关系往往有着不同的策略行为。一部分开发者为了获胜,往往衡量比较对手的能力水平,以此来避免与高水平开发者竞争,从而提升自己获胜概率;而另一部分开发者积极参与比赛,并不关注对手的实力强弱以及输赢结果;有些开发者甚至积极与高水平开发者竞争,在激烈竞争中提升自己能力。因而,为众包任务推荐开发者时,开发者之间的竞争关系也影响着推荐准确性,不同开发者对竞争关系的决策也不同,对开发者之间的竞争关系进行分析至关重要,合理利用竞争关系提升推荐的准确性。
针对众包软件开发中的开发者和任务匹配问题,现有的方法主要从开发者的能力和任务本身的内容出发。通过分析任务本身的属性(需求、语言、技能、周期等)及开发者的兴趣和特长信息来进行推荐。然而,众包软件中任务存在明显“偏置”现象,不同的任务需求、技能信息各不相同,同时开发者也存在着不同的活跃时间段。而现有的方法忽略了众包任务的“偏置”特点以及开发者之间的关联关系,推荐的准确率差,导致出现众包开发过程中出现任务注册缺少交付、代码质量指标不达标、任务由于无可靠交付被取消等技术问题,严重影响整体的项目质量。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711013436.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理