[发明专利]一种基于对抗学习的鲁棒性教学知识点识别方法与装置在审

专利信息
申请号: 202211111245.2 申请日: 2022-09-13
公开(公告)号: CN115587180A 公开(公告)日: 2023-01-10
发明(设计)人: 胡玥;翁金塔;严基杰;林锦天;谢玉强 申请(专利权)人: 中国科学院信息工程研究所
主分类号: G06F16/35 分类号: G06F16/35;G06N3/094;G06F16/36;G06F40/289;G06F18/214;G06F18/241;G06N3/0464
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 邱晓锋
地址: 100093 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 对抗 学习 鲁棒性 教学 知识点 识别 方法 装置
【说明书】:

发明涉及一种基于对抗学习的鲁棒性教学知识点识别方法与装置。本发明对三个方面进行改进:1)数据制作:通过对计算机网络的电子教材数据进行处理并总结归纳,构建出一套计算机网络科目的知识点识别数据集,作为模型的输入;2)模型改进:在ALBERT与TextCNN结合模型的基础上进行了模型结构的改动,在ALBERT的隐藏层输出中结合了输入句子中实体的信息,提高了模型捕捉实体信息的能力;3)方法改进:对模型的训练过程进行了新的改进,添加了对抗训练,有效地提高了模型的泛化能力与鲁棒性。本发明将ALBERT与TextCNN的结合模型运用于知识点识别任务中,并对模型结构与训练方法进行改进,能够有效地进行教学知识点的自动识别。

技术领域

本发明属于信息技术、自然语言处理技术领域,涉及文本分类技术,具体涉及一种基于对抗学习的鲁棒性教学知识点识别方法与装置。

背景技术

由于近年来互联网的发展以及在疫情的特殊时期的背景下,慕课平台(MassiveOpen Online Course,MOOC)在教育领域发挥着巨大的作用并满足于人们日常学习生活的需求,在线教育领域的发展也越来越得到人们的关注。根据《新常态下的中国慕课与在线教育》中的数据,至2021年底,全球(除中国外)的慕课课程数量超过了19400门,覆盖2.2亿用户,而且2021年内,新上线的慕课数量达到了3100门,新增学习者数量达4000万。伴随着慕课平台发展的同时,如何向学习者推荐高质量的MOOC视频和开展更加多维度的在线视频分析成为教育变革关注的重点。

一般来说,MOOC学习推荐是通过适当的方式推荐学习者最匹配的教学知识点及其视频,因此,围绕知识点开展相关的识别和分类工作对于MOOC推荐及其重要,如包括制作慕课数据集、关键知识点抽取、知识点识别等。对于慕课平台来说,倘若准确掌握了教学视频内容中的知识点,还能极大优化平台中视频资源的管理、推进平台推荐系统的升级以及改善用户在慕课平台中的使用体验,这对于平台的推广有着极大的积极作用。另一方,知识点识别还能使得学习者不必陷入麻木的“课程海洋”中,做到精准的教学匹配,减少不必要的学习者负荷和搜索损耗。

知识点识别作为文本分类领域中的分支,其是自然语言处理领域中的文本分类任务在教育领域上的运用,主要涉及自然语言处理领域中的文本分类技术。文本分类,又称为自动文本分类,它是指计算机将载有信息的一篇文本,映射到预先给定的某些类别或者某些主体的过程。文本分类作为自然语言处理领域的经典问题,其也存在有非常多主流的应用场景,比如:情感分析、话题标记、新闻分类、问答系统、对话行为分类以及关系分类等等。作为在自然语言处理领域的经典问题,文本分类任务随着自然语言处理的发展其本身也在不断的突破与创新。近年来,随着预训练模型在自然语言处理的各个任务上的优异表现,越来越多学者、组织机构对预训练模型展开了更深的探索与研究,将模型的优异表现拓展到多个应用场景中。

由于模型被使用到不同的应用场景,其对模型的泛化性表现有了更高的要求。近年来,计算机视觉领域中广泛使用了对抗训练的方式增强神经网络的鲁棒性。在对抗训练中,样本在训练过程中会被加入一些微小的扰动,而这些扰动能够在一定程度上干扰模型的判断,同时使得模型在训练中学习到更多的特征,同样的原理也可以应用在自然语言处理任务中。

然而,对于如何利用文本分类技术运用于教育场景下的知识点识别问题以及如何在知识抽取模型的训练过程中加入对抗训练策略,仍然未被充分的探索与研究。

知识点识别是将教育领域中的课程描述数据,以自动化的方式标注出数据所包含的知识点。随着在线教育领域的飞速发展,关于利用自然语言处理领域技术解决知识点分析的问题,涌现出了大量知识点利用的相关技术和方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211111245.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top