[发明专利]一种基于对抗学习的鲁棒性教学知识点识别方法与装置在审
申请号: | 202211111245.2 | 申请日: | 2022-09-13 |
公开(公告)号: | CN115587180A | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 胡玥;翁金塔;严基杰;林锦天;谢玉强 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/094;G06F16/36;G06F40/289;G06F18/214;G06F18/241;G06N3/0464 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对抗 学习 鲁棒性 教学 知识点 识别 方法 装置 | ||
本发明涉及一种基于对抗学习的鲁棒性教学知识点识别方法与装置。本发明对三个方面进行改进:1)数据制作:通过对计算机网络的电子教材数据进行处理并总结归纳,构建出一套计算机网络科目的知识点识别数据集,作为模型的输入;2)模型改进:在ALBERT与TextCNN结合模型的基础上进行了模型结构的改动,在ALBERT的隐藏层输出中结合了输入句子中实体的信息,提高了模型捕捉实体信息的能力;3)方法改进:对模型的训练过程进行了新的改进,添加了对抗训练,有效地提高了模型的泛化能力与鲁棒性。本发明将ALBERT与TextCNN的结合模型运用于知识点识别任务中,并对模型结构与训练方法进行改进,能够有效地进行教学知识点的自动识别。
技术领域
本发明属于信息技术、自然语言处理技术领域,涉及文本分类技术,具体涉及一种基于对抗学习的鲁棒性教学知识点识别方法与装置。
背景技术
由于近年来互联网的发展以及在疫情的特殊时期的背景下,慕课平台(MassiveOpen Online Course,MOOC)在教育领域发挥着巨大的作用并满足于人们日常学习生活的需求,在线教育领域的发展也越来越得到人们的关注。根据《新常态下的中国慕课与在线教育》中的数据,至2021年底,全球(除中国外)的慕课课程数量超过了19400门,覆盖2.2亿用户,而且2021年内,新上线的慕课数量达到了3100门,新增学习者数量达4000万。伴随着慕课平台发展的同时,如何向学习者推荐高质量的MOOC视频和开展更加多维度的在线视频分析成为教育变革关注的重点。
一般来说,MOOC学习推荐是通过适当的方式推荐学习者最匹配的教学知识点及其视频,因此,围绕知识点开展相关的识别和分类工作对于MOOC推荐及其重要,如包括制作慕课数据集、关键知识点抽取、知识点识别等。对于慕课平台来说,倘若准确掌握了教学视频内容中的知识点,还能极大优化平台中视频资源的管理、推进平台推荐系统的升级以及改善用户在慕课平台中的使用体验,这对于平台的推广有着极大的积极作用。另一方,知识点识别还能使得学习者不必陷入麻木的“课程海洋”中,做到精准的教学匹配,减少不必要的学习者负荷和搜索损耗。
知识点识别作为文本分类领域中的分支,其是自然语言处理领域中的文本分类任务在教育领域上的运用,主要涉及自然语言处理领域中的文本分类技术。文本分类,又称为自动文本分类,它是指计算机将载有信息的一篇文本,映射到预先给定的某些类别或者某些主体的过程。文本分类作为自然语言处理领域的经典问题,其也存在有非常多主流的应用场景,比如:情感分析、话题标记、新闻分类、问答系统、对话行为分类以及关系分类等等。作为在自然语言处理领域的经典问题,文本分类任务随着自然语言处理的发展其本身也在不断的突破与创新。近年来,随着预训练模型在自然语言处理的各个任务上的优异表现,越来越多学者、组织机构对预训练模型展开了更深的探索与研究,将模型的优异表现拓展到多个应用场景中。
由于模型被使用到不同的应用场景,其对模型的泛化性表现有了更高的要求。近年来,计算机视觉领域中广泛使用了对抗训练的方式增强神经网络的鲁棒性。在对抗训练中,样本在训练过程中会被加入一些微小的扰动,而这些扰动能够在一定程度上干扰模型的判断,同时使得模型在训练中学习到更多的特征,同样的原理也可以应用在自然语言处理任务中。
然而,对于如何利用文本分类技术运用于教育场景下的知识点识别问题以及如何在知识抽取模型的训练过程中加入对抗训练策略,仍然未被充分的探索与研究。
知识点识别是将教育领域中的课程描述数据,以自动化的方式标注出数据所包含的知识点。随着在线教育领域的飞速发展,关于利用自然语言处理领域技术解决知识点分析的问题,涌现出了大量知识点利用的相关技术和方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211111245.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种三形态可折叠式课桌椅结构
- 下一篇:方便拆卸的制冰机