[发明专利]一种基于在线教育大数据的深度学习样本标注方法在审

专利信息
申请号: 201811488434.5 申请日: 2018-12-06
公开(公告)号: CN109783661A 公开(公告)日: 2019-05-21
发明(设计)人: 阮怀伟;杨小红;吴雷;王鹏飞;吴立辉;王瑞丽;程桃莉 申请(专利权)人: 安徽教育网络出版有限公司;时代新媒体出版社有限责任公司
主分类号: G06F16/48 分类号: G06F16/48;G06F16/44
代理公司: 合肥鼎途知识产权代理事务所(普通合伙) 34122 代理人: 徐然
地址: 230601 安徽省合*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及互联网在线教育系统,尤其涉及一种基于在线教育大数据的深度学习样本标注方法,其制备步骤为:(1)数据的导入(2)初步标注(3)数据分组(4)数据展示(5)数据排序(6)不符合的数据重新分组(7)得到不同类型的数据库。本发明通过设计一种基于在线教育大数据的深度学习样本标注方法,解决了现有技术的不足,无需人工的体力劳动,且避免了个人的主观性判断,通过数据的初步标注和分组标注,使得数据的准确性更高,通过在线教育大数据的标注系统,可以发动互联网上的大量人员协助对于海量数据的标注,整个发明思路清晰明确,能够有效地提高大数据的标注精度,同时缩短了标注时间,过程简单,实用性高。
搜索关键词: 标注 大数据 在线教育 学习样本 在线教育系统 标注系统 海量数据 数据分组 数据排序 数据展示 重新分组 互联网 人工的 有效地 主观性 制备 数据库 分组 清晰 发动
【主权项】:
1.一种基于在线教育大数据的深度学习样本标注方法,其特征在于:第一步:输入需标注的在线教育数据A个,且输入的数据均为同一类别;将需标注的在线教育数据存储到数据库中;第二步:初步标注,对在线教育数据进行初步标注,然后分类,分为Q、W、E、R;第三步:将Q类的数据导出,共有N个数据,将Q类的数据进行分组,共有m组,每组有n个数据,最后一组有N‑n*m个数据;第四步:对每一组中的m个数据进行展示,并仅对其中的一个数据进行标注;当N<n时,只需要进行一次展示;当N个数据全部完成第一轮展示后,统计出每个数据被标记的次数;第五步:按照从高到低的顺序,对所有数据被标记的次数进行排列;第六步:取数据被标注的次数大于B为符合该分类的有效数据;第七步:标记次数小于B的数据,平均分成3组,分别放入W、E、R组中,参与接下来剩余组的展示标注;第八步:W组的标注方法与Q组相同,当W组标记结束后,将标记次数小于K的数据平均分成两组,放入E和R组中,E和R标注时重复步骤三;第九步:得到不同类型的数据库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽教育网络出版有限公司;时代新媒体出版社有限责任公司,未经安徽教育网络出版有限公司;时代新媒体出版社有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811488434.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top