[发明专利]一种基于用户行为的学术资源推荐方法有效
申请号: | 201611128680.0 | 申请日: | 2016-12-09 |
公开(公告)号: | CN106802915B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 刘柏嵩;尹丽玲;王洋洋;高元;费晨杰 | 申请(专利权)人: | 宁波大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/332;G06F16/338 |
代理公司: | 宁波奥圣专利代理事务所(普通合伙) 33226 | 代理人: | 程晓明 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 行为 学术 资源 推荐 方法 | ||
1.一种基于用户行为的学术资源推荐方法,其特征在于,包括以下步骤:
①对资源库中的所有学术资源从资源类型、学科分布、关键词分布和LDA主题分布共四个维度进行建模,得到学术资源模型;
②根据筛选规则,对资源库中的所有学术资源进行筛选,得到待推荐的学术资源集合;
③从用户行为日志中获取用户的浏览记录,计算用户对浏览过的每条学术资源产生的行为系数;
④基于行为系数与学术资源模型构建用户兴趣模型;
⑤计算学术资源模型和用户兴趣模型之间的相似度,得到待推荐学术资源集合中每条学术资源与用户兴趣模型之间的相似度;
⑥根据相似度,从待推荐学术资源集合中对用户进行Top-N推荐;
所述的步骤①中对资源库中的所有学术资源从资源类型、学科分布、关键词分布和LDA主题分布共四个维度进行建模,得到学术资源模型的操作具体包括:
将所述的学术资源模型记为Mr,Mr={Tr,Kr,Ct,Lr},其中,Tr为学科分布向量,由贝叶斯多项式模型训练得到,所述的学科分布为学术资源在75个学科中的概率分布,其中75个学科为根据教育部公布的89个硕士专业整合后得到;
Kr为关键词分布向量,Kr={(kr1,ωr1),(kr2,ωr2),...,(kri,ωri),...,(krN1,ωrN1)},N1为关键词个数,kri表示单条学术资源第i个关键词,其中1≤i≤N1,ωri为关键词kri的权重,ωri通过改进后的TF-IDF算法计算得到,公式如下:
其中,ωri表示学术资源r中第i个关键词的权重,tf(r,i)表示第i个关键词在学术资源r中出现的频度,Z表示学术资源总数,l表示包含关键词i的学术资源数量;
Ct为资源类型,t的取值为1,2,3,4,5;
Lr为学术资源的LDA主题分布向量,Lr={lr1,lr2,lr3,...,lrq,...,lrN2},lrq表示学术资源r属于第q个学科的概率,其中1≤q≤N2,N2为LDA潜在主题数量,Lr由LDA模型训练得到;
所述的步骤④中基于行为系数与学术资源模型构建用户兴趣模型的操作具体包括:
将所述的用户兴趣模型记为Mu,Mu={Tu,Ku,Ct,Lu},其中,Tu为用户的学科偏好向量,即
其中,sum为用户浏览过的学术资源总数,Sj为用户对j产生的行为系数,反映用户对j的偏好程度,Tjr为j的学科分布向量;
Ku为用户的关键词偏好向量,首先将行为系数S与关键词分布向量Kr相乘计算出用户浏览过的每篇学术资源新的关键词分布,然后选取所有学术资源新的关键词分布的TOP-N3作为用户的关键词偏好向量Ku,N3为用户偏好关键词个数;
Lu为用户的LDA主题偏好向量,即
其中,Ljr为j的LDA主题分布向量。
2.根据权利要求1所述的一种基于用户行为的学术资源推荐方法,其特征在于,所述的步骤①中还包括:对资源库中的所有学术资源计算每条学术资源的权威度、社区热度和时新度三个特征值,根据这三个特征值计算并得到每条学术资源的质量值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611128680.0/1.html,转载请声明来源钻瓜专利网。