[发明专利]知识追踪方法及系统有效
申请号: | 202210096742.3 | 申请日: | 2022-01-25 |
公开(公告)号: | CN114117033B | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 马玉玲;韩鹏;崔超然;郭杰;聂秀山;尹义龙;李振 | 申请(专利权)人: | 山东建筑大学 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06K9/62;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250101 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 追踪 方法 系统 | ||
本发明涉及专门适用于预测目的的数据处理技术领域,公开了知识追踪方法及系统,方法包括:获取待知识追踪学生的若干个已做试题、每个已做试题对应的知识点及每个已做试题的得分;对所有已做试题进行编码得到试题初始表征,对试题初始表征进行特征提取,得到试题的第一试题嵌入表征;对已做试题对应的知识点进行编码得到试题对应的知识点初始表征,对试题对应的知识点初始表征进行特征提取,得到试题对应的知识点嵌入表征;对试题的第一试题嵌入表征和试题对应的知识点嵌入表征进行关联,得到试题的第二试题嵌入表征;根据试题的第二试题嵌入表征和已做试题得分,确定学生对不同知识点的掌握度。本发明显著提高知识追踪模型的准确率。
技术领域
本发明涉及专门适用于预测目的的数据处理技术领域,特别是涉及知识追踪方法及系统。
背景技术
本部分的陈述仅仅是提到了与本发明相关的背景技术,并不必然构成现有技术。
因材施教作为提高学习效率和教育产出的主要手段之一,一直备受教育工作者的关注。然而,因材施教的关键问题是对“材”的精准分析,即需要对学习者的知识掌握水平进行精准的评估、从而为其提供更有针对性的学习资源推荐和个性化指导。传统借助“考试”给出学生得分之类的评估方法,评价粒度较粗,难以凸显学生对具体知识概念的掌握情况。例如,学生甲和学生乙在某次数学测验中均得了80分,但是,有可能存在学生甲答错的试题,学生乙均回答正确的情况,反之亦然。这说明两人虽然得分相同,但知识概念的掌握情况却存在较大差异。如何自动、精确、细粒度地建模出学生在每一个知识概念上的掌握水平是因材施教、个性化教学工作高质量开展的基本前提。
知识追踪KT(Knowledge Tracing)可以借助机器学习和大数据技术根据学生以往学习轨迹实现对学生知识水平的实时评估与跟踪,以便能够准确地预测学生未来的学习与答题表现,从而为学生个性化和自适应的学习提供技术支撑,已成为大规模在线学习系统的核心技术之一。一般来讲,教师在制定考试题目的时候,首先要考虑的基本问题是考哪些知识点,然后设计出最能体现这些知识点的试题。知识追踪问题可以形式化为:给定一个学生在特定学习任务上的以往答题序列,其中,有序对表示学生在时间作答了试题,其作答情况(得分)为。多数情况下,每个问题会包含对应考核的知识点信息,学生对该学习任务包含的所有知识点有着不同的掌握程度,便构成了该学生的知识水平。知识追踪的任务是基于学生以往答题序列信息对其知识水平进行建模,并预测该学生在下一时刻试题上的作答表现。目前,比较流行的知识追踪模型有贝叶斯知识追踪模型BKT(Bayesian KnowledgeTracing)和深度知识追踪模型DKT(Deep Knowledge Tracing)。其中,BKT通过建模与学生答题表现密切相关的四个参数,包括:学生初始知识水平、学生经过一次答题掌握对应知识概念的能力、猜测和粗心等,并根据学习到的参数利用贝叶斯公式实时地对学生的知识掌握水平进行更新。但是,该模型受到诸多因素的制约而影响了评估结果的精准性,例如:采用一个二值向量表示学生的知识掌握水平,1/0表示掌握/未掌握某个知识概念,这种非0即1的表示形式难以准确表示学生的知识状态。此外,BKT模型假设学生一旦掌握某个知识概念便不会遗忘,这在一定程度上影响了模型的准确性。
近年来,基于深度神经网络的知识追踪方法得到了广泛的关注,研究者于2015年提出了深度知识追踪模型DKT,并首次将循环神经网络RNN(Recurrent Neural Network)用在知识追踪任务上。相比于传统BKT模型,DKT在Assistments数据集上AUC值(一种衡量模型准确率的指标,值越大,模型性能越好)高出近25个百分点。自此以后,深度学习成为受关注的建模方法之一。
得益于深度神经网络函数自身的复杂性,深度知识追踪模型因为可以捕捉人类学习的复杂表现而取得了优于传统方法的性能。但是,发明人发现基于深度神经网络的方法大多采用“独热表示”方法对试题、知识点、回答表现等信息进行编码。该编码方式简单、易于理解,但是无法利用到试题之间的关系、知识点之间的关系、以及试题与知识点之间的关系。然而这些关系客观存在,若不能加以利用,则会在很大程度上限制了模型性能的进一步提升。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东建筑大学,未经山东建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210096742.3/2.html,转载请声明来源钻瓜专利网。