[发明专利]一种基于大数据众包模式数据标注的方法及装置在审
申请号: | 201810980947.1 | 申请日: | 2018-08-27 |
公开(公告)号: | CN109241513A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 黄佳威 | 申请(专利权)人: | 上海宝尊电子商务有限公司 |
主分类号: | G06F17/24 | 分类号: | G06F17/24 |
代理公司: | 上海卓阳知识产权代理事务所(普通合伙) 31262 | 代理人: | 金重庆 |
地址: | 200436 上海市静安*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于大数据众包模式数据标注的方法及装置,所述方法包括以下步骤:步骤S1.采用自动化算法标注方式提供预数据标注;步骤S2.由众包模式对所有标注进行分发,只判断标注对错,减低标注者在专业领域的能力需求;步骤S3.由众包数据整合,综合统计所有数据标注结果,提高数据准确。其优点表现在:本发明的一种基于大数据众包模式数据标注的方法及装置,针对人工标注的效率问题和培训成本问题,同时针对自动化标注中准确率相对较低的问题。结合众包中降低人工能力的要求,通过匹配算法结合三者的优点来提高标注中的效率、准确性和可扩展性。 | ||
搜索关键词: | 标注 模式数据 大数据 数据标注 自动化算法 可扩展性 能力需求 培训成本 匹配算法 人工标注 效率问题 专业领域 包数据 准确率 整合 分发 自动化 表现 统计 | ||
【主权项】:
1.一种基于大数据众包模式数据标注的方法,其特征在于,所述方法包括以下步骤:步骤S1.采用自动化算法标注方式提供预数据标注;步骤S2.由众包模式对所有标注进行分发,只判断标注对错,减低标注者在专业领域的能力需求;步骤S3.由众包数据整合,综合统计所有数据标注结果,提高数据准确。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宝尊电子商务有限公司,未经上海宝尊电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810980947.1/,转载请声明来源钻瓜专利网。