[发明专利]一种基于信任模型的鲁棒众包数据分析方法有效
申请号: | 202010551752.2 | 申请日: | 2020-06-17 |
公开(公告)号: | CN112396279B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 孙杰;焦玉全;吴礼发 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210012 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信任 模型 鲁棒众包 数据 分析 方法 | ||
本发明公开了一种基于信任模型的鲁棒众包数据分析方法,通过使用贝塔分布来分析众包工作者的历史信誉度信息,然后利用投票一致性规则来分析部分众包工作者在当前任务中任务结果的数据,最后运用贝叶斯算法来预测本次众包工作者提供的结果数据的准确度信息,能够让雇主在大量不确定的众包数据结果中,获得符合需求的高准确度众包数据,解决了雇主以往无法获得符合需求的众包数据结果的难题。
技术领域
本发明涉及推荐算法领域,特别涉及一种基于信任模型的鲁棒众包数据分析方法。
背景技术
目前存在的一些推荐类算法能够根据雇主需求,对众包工作者(完成众包任务的一方)提供的众包结果数据进行分析,筛选出高质量的结果数据推荐给用户。其中,很多众包数据筛选方法是依赖众包工作者的历史行为数据的推荐算法,因此一旦众包工作者在此次任务中工作状态出现变化,那么工作者的历史行为数据评估结果和此次任务中工作者提交的结果数据精度就会出现比较大的偏差,即众包工作者在此次任务中提交的结果数据实际准确度比预估计的要低。因此,如何能够使雇主在任何情况下都能够获得高准确度的众包结果数据,成为当下众包数据质量研究的难点。
目前针对高质量众包数据筛选面临的问题,是众包领域急需解决的难题。而本发明能够很好地解决上面的问题。
发明内容
发明目的:本发明提供了一种基于信任模型的鲁棒众包数据分析方法,更高效更准确的进行众包数据的筛选。
技术方案:本发明所述的一种基于信任模型的鲁棒众包数据分析方法,包括有以下步骤:
S1:根据众包平台提供的众包工作者基本信息提取出众包工作者的历史信誉度信息;
S2:用贝塔分布对S1提供的历史信誉度信息进行分析,得出众包工作者工作精度的验前分布;
S3:根据数据集随机选取部分众包工作者在本次雇主发布的任务完成后的任务结果;
S4:用投票一致性规则对S3提供的部分众包任务结果数据进行分析,得出众包数据准确度的条件概率;
S5:将S2得出的先验信息和S4得出的条件概率通过贝叶斯模型进行结合计算,得出众包工作者此次提交数据结果的验后准确度信息。
作为优选,所述S1中提取的众包工作者的历史信誉度信息以众包工作者最稳定的一段连续时间内的k次任务结果的准确度信息作为历史信誉信息。
作为优选,所述S2中用贝塔分布分析历史信誉度信息具体包括以下步骤:
S2.1:工作者提供的结果精度a表示工作者完成任务的准确度,a的验前分布 g(αm),m=(1,2,3…,m),共有m名工作者。
S2.2:贝塔分布的概率密度函数为:
其中α、β分别为贝塔分布的两个参数,Γ为伽马函数,其中:
Γ(α)=∫0tα-1e-tdt;
Γ(α+1)=αΓ(α),α>0;
当α为正整数时:
Γ(n)=(n-1)!;
贝塔分布的均值的计算公式为:
贝塔分布方差的计算公式为:
S2.3:根据S1提供的历史信誉信息,可以得到k次任务结果的准确度均值,计算公式为:
同时可以求的k次任务结果的准确度的方差,计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010551752.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理