[发明专利]一种结合用户画像的题目推荐方法及系统在审
| 申请号: | 201910965991.X | 申请日: | 2019-10-12 |
| 公开(公告)号: | CN110704510A | 公开(公告)日: | 2020-01-17 |
| 发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中森云链(成都)科技有限责任公司 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/9535;G06Q10/04;G06Q50/20 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 610041 四川省成都市*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 画像 题目 在线编程系统 多目标优化 计算机技术 额外输出 学习系统 因子模型 用户使用 用户推荐 信任度 正确率 知识点 建模 编程 个性化 优化 | ||
1.一种结合用户画像的题目推荐方法,其特征在于包括以下步骤:
步骤1:收集用户的历史做题数据和题目标签信息,并进行预处理,得到用户的显式反馈、隐式反馈和邻居关系;
步骤2:将数据集划分为训练集和测试集;
步骤3:使用自编码器,利用用户的显式反馈、隐式反馈和邻居关系进行用户画像,同时得到用户隐表示;
步骤4:利用题目的标签信息和用户的显式反馈,学习得到题目隐表示;
步骤5:基于用户隐表示和题目隐表示,预测用户在题目上的得分,并根据得分进行题目推荐。
2.根据权利要求1所述的一种结合用户画像的题目推荐方法,其特征在于:所述步骤1是收集用户的历史做题数据和题目标签信息,并进行预处理,得到用户的显式反馈、隐式反馈和邻居关系,具体方法如下:
a1.对于用户集合U,其大小为n,表示n个用户;题目知识点集合K,其大小为s,表示s个知识点;题目集合I,其大小为m,表示m道题目;根据用户做题结果,其中1表示做题正确,0表示做题错误,-1表示点击但没有做题,将做题结果为-1的历史记录作为隐式反馈,其余历史记录作为显式反馈;
a2.设置一个阈值,当两个用户做过相同题目的数量大于该值时,认为这两个用户是邻居,据此构建系统中用户的邻居关系;
a3.定义n行m列的用户-题目交互矩阵R,根据用户显式反馈填充矩阵,矩阵元素取值如下:
3.根据权利要求1所述的一种结合用户画像的题目推荐方法,其特征在于:所述步骤2是将数据集划分为训练集和测试集,具体方法为:对步骤2得到的用户题目交互矩阵R,随机选择20%的交互数据作为测试集,用剩余的交互数据进行训练。
4.根据权利要求1所述的一种结合用户画像的题目推荐方法,其特征在于:所述步骤3是使用自编码器,利用用户的显式反馈、隐式反馈和邻居关系进行用户画像,同时得到用户隐表示;具体过程如下:
b1.定义两个n行s列矩阵,分别是用户-知识点正确率矩阵A和用户-知识点点击率矩阵H,矩阵元素分别为用户在知识点上的正确率和点击率,分别由用户的显式反馈和隐式反馈统计得到,具体地,用户u在知识点k上的正确率auk计算方式为:用户在知识点k上做对的题目数占用户在该知识点上做题总数的百分比;用户u在知识点i上的点击率hui计算方式为:用户在知识点i上点击过的题目数占用户点击总数的百分比;
b2.根据用户-知识点正确率矩阵A,对每个用户u,矩阵A的第u行代表该用户的显式反馈,即知识点正确率,表示为au;使用一个全连接网络对au进行编码,得到用户u在显式反馈上的隐表示计算如下:
其中,Wau∈Rs*d是待学习的网络参数,d是隐表示的维度,bau∈Rd是偏置向量;
b3.根据用户-知识点点击率矩阵H,对每个用户u,矩阵H的第u行代表该用户的隐式反馈,即知识点点击率,表示为hu;使用另一个全连接网络对hu进行编码,得到用户u在隐式反馈上的隐表示计算如下:
其中,Whu∈Rs*d是待学习的网络参数,d是隐表示的维度,bhu∈Rd是偏置向量;
b4.利用一个神经门结构融合从显式反馈和隐式反馈中学习到的用户隐表示,这个神经门层用G来表示,融合后的用户隐表示用来表示,也可以看作一种稠密的用户画像,其中编码了用户的知识点正确率和点击率信息;G和的计算如下:
其中,Wg1∈Rd*d,Wg2∈Rd*d,bg∈Rd是门层的参数。
b5.基于融合的用户隐表示,利用用户的邻居关系,预测用户对不同知识点的掌握程度;具体过程如下:
c1.定义用户u的邻居集合为Ni,基于融合的用户隐表示计算用户对邻居的注意力得分,进而得到用户u在邻居关系上的隐表示,计算如下:
au=softmax(su) (6)
其中,Wn∈Rd*d是需要学习的参数,d是隐表示的维度;
c2.使用共享的解码器分别对融合的用户隐表示和用户的邻居隐表示进行解码,将解码后的向量进行逐元素相加后,经过激活函数得到用户在各个标签上的正确率预测值,该值反映了用户对该标签的掌握程度;解码器实现如下:
c3.综上,本发明基于一个自编码器模型进行用户画像,编码器部分从用户的显式反馈和隐式反馈中学习用户隐表示,两种隐表示通过一个神经门结构进行融合后送入解码器,解码器在解码时,同时利用用户的邻居关系来重构用户的显式反馈,即用户在知识点上的正确率;通过最小化重构误差来优化自编码器的参数,即最小化如下目标函数:
其中,是正则项,防止模型过拟合;
c4.对b3、b4得到的两种用户隐表示和进行拼接,得到另一种融合的用户隐表示pu,用于后续的推荐模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中森云链(成都)科技有限责任公司,未经中森云链(成都)科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910965991.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据分类方法、装置、设备及存储介质
- 下一篇:数据处理方法、设备、装置、介质





