[发明专利]一种基于元学习的众包软件开发者推荐方法有效
申请号: | 201810642091.7 | 申请日: | 2018-06-21 |
公开(公告)号: | CN109032591B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 孙海龙;王旭;张振羽;刘旭东 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F8/35 | 分类号: | G06F8/35;G06N3/04 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 学习 软件 开发者 推荐 方法 | ||
一种基于元学习的众包软件开发者推荐方法,所述方法中的模型总体包含三个主要组件,注册行为预测器,提交行为预测器,获胜行为预测器,所述提交行为预测器基于用户已经注册后的情况进行预测,获胜行为预测器基于用户已经提交后的情况进行预测,注册者预测器预测没有任何先决条件,在所述注册行为预测器对任务数据集进行学习中,如果输出的注册概率不在前top R,则用户获胜概率为0,终止该实例预测,否则继续使用提交行为预测器进行输出检测;在提交行为预测器中,如果输出的提交概率不在前top S,则用户的获胜概率为0,终止该实例预测,否则进入获胜行为预测器;最后由用户获胜行为预测器得到获胜概率,并根据获胜概率推荐前K个用户的列表。
技术领域
本发明涉及智能推荐方领域,尤其涉及一种基于元学习的众包软件开发者推荐方法。
背景技术
众包软件开发是众包技术在软件开发领域的应用。软件需求方根据功能或者特性将复杂软件进行模块切分后将全部或者部分软件模块以众包开发任务的形式外包出去,让大众开发者去完成这些任务。现在业界出现了不少众包软件开发平台,比如Topcoder、Kaggle等,其中最大的平台是Topcoder。Topcoder平台10多年来一直引领着众包软件开发的潮流,并拥有超过100万的用户。典型的众包软件开发流程包括:软件需求方在众包平台发布软件开发任务;用户(开发者)选择合适的任务进行注册;注册开发者者提交相应的工作;最后根据评审规则确定开发者得分选择获胜者。根据数据统计,23%的任务注册用户不会提交任何工作,这种极高的放弃率会导致任务失败。如何尽可能早地选择潜在的获胜者,即将可靠性高的人推荐出来从而提升软件开发效率和保障软件质量,是众包软件开发领域中的重要问题。
现有技术中,在处理众包软件开发者推荐时主要从两个角度切入:(1)基于已经过滤的用户做多标签分类,构建相应的分类器,预测最为可靠的用户。这种方法认为可靠的用户一般具有多次的获胜历史,从而将获胜次数低于一定阈值的用户进行过滤,最后保留少量开发者,并把这些开发者作为标签,采用一些任务的属性综合起来构建分类器,预测可能获胜的用户,并把他们作为可靠用户推荐给相关的开发任务。(2)基于用户状态来预测用户角色。这种方法认为用户当前的状态以及相应的历史,对他之后的行为会产生影响。用户角色可以划分为注册者,提交者和获胜者。他们基于用户当前已经注册的用户的历史数据来预测用户的提交情况,进而判断用户是否是提交者;根据已经提交了工作的用户的历史数据和提交情况来预测用户的获胜几率,进而判断用户是否为获胜者。
现有技术在推荐可靠用户时,在没有任何用户状态信息时准确率不高,之前采用多标签分类的技术,top5的准确率最高不超过70%;二基于角色的预测方法,在未知用户注册状态时,很难对用户是否为注册者进行预测,进而无法准确地预测后续状态。
现在的技术方案都仅能针对大数据集进行分析建模,缺乏对小数据集的研究。由于多标签分类需要大量的数据才能训练出一个非常完美的模型,从而限制了这种方法在数据量不足时的应用。此外,基于用户角色的数据角色预测方法,需要使用用户的历史数据,小数据集上的用户历史显然太少,这导致我们难以训练模型。
现有技术缺乏对于冷启动问题的解决。多标签形式的分类问题,基本假设中认为只有注册次数高于一定阈值时才是可靠的,那些获胜历史少的用户都被过滤,这导致对于一些缺少获胜历史的用户难以进行推荐。而基于用户角色的预测,依旧需要大量的用户历史数据才能训练分类器,对于那些缺乏相应历史的用户,则无法处理。
发明内容
本发明针对众包软件开发者推荐的问题,提出了一种基于元学习的众包软件开发者推荐方法,从而保证软件质量和开发效率。本发明解决众包软件开发者推荐中的三个问题:(1)众包任务的历史数据量不足,难以准确建模;(2)众包软件开发过程中用户注册、提交等状态不明确致使推荐范围受限的问题;(3)用户缺乏历史数据导致的冷启动问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810642091.7/2.html,转载请声明来源钻瓜专利网。