[发明专利]一种基于多元概念注意力模型的知识追踪方法及系统有效
| 申请号: | 202110710894.3 | 申请日: | 2021-06-25 | 
| 公开(公告)号: | CN113378581B | 公开(公告)日: | 2023-06-06 | 
| 发明(设计)人: | 徐斌;吴豪 | 申请(专利权)人: | 浙江工商大学 | 
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F18/2415;G06N3/0442;G06N3/08 | 
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 | 
| 地址: | 310018 浙江*** | 国省代码: | 浙江;33 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 多元 概念 注意力 模型 知识 追踪 方法 系统 | ||
1.一种基于多元概念注意力模型的知识追踪方法,其特征在于,该方法包括:
(1)获取学习者的历史习题回答的交互序列;所述交互序列包括习题标签和回答情况;所述习题标签包含习题键索引k和知识概念索引c;根据时间轴顺序,将历史习题回答的交互序列与知识组件组合成一个含有知识状态的序列;
(2)建立多元概念注意力模型;
根据学习者的习题键索引k将历史习题回答的交互序列X划分为M个不同大小的注意力模块;每个注意力模块中知识概念索引c和习题键索引k做注意力映射,得到数据单元的习题键索引;结合注意力模块中每个数据单元的注意力分数值,得到每个注意力模块的输出数据;
(3)建立多元语义注意力模型;
所述多元语义注意力模型包括依次连接的输入层、情感意识注意层和长短期记忆网络;
将每个注意力模块的输出数据Ym通过输入层传入情感意识注意层;所述情感意识注意层中,利用上下文的内容和内容语义关系计算上下文组块数据cot;
将Ym和cot按矩阵行拼接构成第m个注意力模块的注意力特征向量int;
将int输入长短期记忆网络,在长短期记忆网络中整合上下文组块之间的相似性;所述长短期记忆网络由记忆元组、激活函数和门控单元组成;所述门控单元用于更新cot,从而对学习者的知识状态进行追踪;
将更新后的cot与Ym拼接构成第m个注意力模块的最终注意力特征向量
(4)将步骤(3)得到的传入注意力分类层,所述注意力分类层将和待测试的习题键索引进行范围点积,然后通过全连接层和Softmax激活函数归一化计算待测试的习题键索引的知识概念分布权重,用分类注意力分数值表示;
(5)将分类注意力分数值和历史回答向量相乘,获取学习者对新习题回答的特征分数值;
(6)根据特征分数值和待测试的习题键索引计算学习者对当前题目正确回答的概率,遍历与当前知识状态相似的历史习题,更新知识状态。
2.根据权利要求1所述的一种基于多元概念注意力模型的知识追踪方法,其特征在于,所述步骤(2)中,第m个注意力模块的输出数据Ym表示为:
其中m*为第m个注意力模块的数据单元总数,km,i为第m个注意力模块的第i个数据单元的习题键索引,为第m个注意力模块的第i个数据单元的注意力分数值;
其中为第m个注意力模块的权值矩阵Wm和第m个注意力模块的第i个数据单元的习题键索引km,i的交互值,其表示为:
3.根据权利要求1所述的一种基于多元概念注意力模型的知识追踪方法,其特征在于,所述步骤(3)中,上下文组块数据cot表示为:
其中N为上下文组块的总数,kt,i为第t时刻第i个上下文组块的习题键索引,αt,i为第t时刻第i个上下文组块的注意力分数值;
其中ht-1是长短期记忆网络的隐含状态,是长短期记忆网络中隐含状态ht-1和第i个注意力分数值连接的权值矩阵,Wi是kt,i的注意力分数值的权值矩阵,表示矩阵按行拼接的运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110710894.3/1.html,转载请声明来源钻瓜专利网。





