[发明专利]一种基于IRT的信息处理方法及装置有效
申请号: | 201611199952.6 | 申请日: | 2016-12-22 |
公开(公告)号: | CN108229683B | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 刘源;李历;高钰舒;张凯磊 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆;胡彬 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 irt 信息处理 方法 装置 | ||
1.一种基于项目反映理论IRT的信息处理方法,其特征在于,包括:
获取预设数量的答题者关于目标题库的答题信息样本;
以IRT模型中的答题者的学习能力、题目的区分度及题目的难度为待估参数构建贝叶斯网络模型,其中,所述待估参数满足包含超参的预设先验分布;
采用变分推断方法确定目标函数对应的变分分布函数,并以所述目标函数和所述变分分布函数的接近程度最小为原则,基于所述贝叶斯网络模型和所述答题信息样本对所述超参进行估计,得到所述超参的参数值,其中,所述目标函数为基于所述答题信息样本的关于所述待估参数的后验估计函数;
根据所得的超参的参数值对所述变分分布函数进行更新;
基于更新后的变分分布函数对所述待估参数进行采样,得到对所述待估参数的估计;
根据所述待估参数的估计结果建立预测模型;
获取当前答题者的当前学习能力;
对于所述目标题库中的候选题目,根据所述当前学习能力、所述候选题目的区分度和难度、以及所述预测模型确定所述当前答题者答对所述候选题目的概率;
当所确定的概率满足预设条件时,向所述当前答题者推送所述候选题目;
其中,所述获取当前答题者的当前学习能力,包括:
假设答题者的学习能力的演进满足维纳过程,并更新所述预测模型;
获取当前答题者的历史答题数据;
根据所述历史答题数据及更新后的预测模型确定所述当前答题者的当前学习能力;
所述假设答题者的学习能力的演进满足维纳过程,并更新所述预测模型,包括:
假设答题者的学习能力的演进满足维纳过程如下:
其中,γ是维纳过程的平滑先验假设参数,θt′+τ为答题者的当前学习能力,θt′为答题者上一次做题时刻t′的学习能力,τ=t-t′表示两次做题的时间间隔;
更新所述预测模型得到更新后的预测模型如下:
其中,
表示题目j在t′时刻的修正区分度,θi,t表示答题者i的当前学习能力,Xi,j,t′表示答题者i关于题目j在t′时刻的做题对错情况,Xi,j,t′=1表示答题者i在t′时刻做对题目j,αj表示题目j的区分度,βj表示题目j的难度系数,表示θi,t满足均值为方差为的预设先验正态分布。
2.根据权利要求1所述的方法,其特征在于,所述待估参数满足包含超参的预设先验分布包括:
所述答题者的学习能力和所述题目的难度满足均值和/或方差为超参的正态分布,所述题目的区分度满足均值和/或方差为超参的对数正态分布。
3.根据权利要求1或2所述的方法,其特征在于,所述基于更新后的变分分布函数对所述待估参数进行采样,得到对所述待估参数的估计,包括:
采用马尔科夫链蒙特卡洛MCMC方法基于更新后的变分分布函数对所述待估参数进行采样,得到对所述待估参数的估计。
4.根据权利要求1或2所述的方法,其特征在于,以所述目标函数和所述变分分布函数的接近程度最小为原则,基于所述贝叶斯网络模型和所述答题信息样本对所述超参进行估计,得到所述超参的参数值,包括:
以所述超参满足使下式最大化为原则,基于所述贝叶斯网络模型和所述答题信息样本对所述超参进行估计,得到所述超参的参数值:
∫q(Z)lnp(X|Z)dZ
其中,设p(Z|X)为目标函数,q(Z)为p(Z|X)对应的变分分布函数,p(X|Z)为基于IRT模型的概率模型表达式,X表示答题信息样本中包含的题目被做对或做错的情况,Z=α,β,θ,α为题目的区分度,β为题目的难度,θ为答题者的学习能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611199952.6/1.html,转载请声明来源钻瓜专利网。