[发明专利]基于兴趣度模型与类型因子的高校图书推荐方法有效
申请号: | 201811154325.X | 申请日: | 2018-09-30 |
公开(公告)号: | CN109472286B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 李伟;梁奎奎;洪之渊 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/06;G06Q50/20 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 兴趣 模型 类型 因子 高校 图书 推荐 方法 | ||
一种基于兴趣度模型与类型因子的高校图书推荐方法,使用K近邻算法将读者聚类,减少计算量;建立了兴趣度模型来量化协同过滤;将类型因子加入到协同过滤计算过程中,提高推荐的准确率。弥补了高校图书馆缺少读者反馈信息的缺点,并充分考虑了高校读者具有专业性和图书具有专业性的特点。实验结果表明,本发明在挖掘过程中稳定性好、准确率高,准确率优于其他的图书推荐算法,满足了高校图书馆图书推荐的需求。
技术领域
本发明涉及读者相似性、K近邻算法、类型因子、图书推荐,是一种基于数据挖掘的高校图书推荐方法。
背景技术
随着信息化的飞速发展,数字图书馆的快速建设,高校图书馆存储了大量学生读者的行为数据,如何有效利用这些数据挖掘出有价值的信息成为了可研究的重要方向。于此同时,个性化推荐在网络生活中的作用越来越明显,准确、高效的推荐系统可以挖掘用户潜在的消费倾向。高校图书馆个性化推荐是将高校图书馆大数据与个性化推荐结合的最好案列。
当前主流的核心推荐算法有三种。一是基于内容的推荐算法,它根据用户过去喜欢的产品,为用户推荐和他过去喜欢的产品相似的产品;二是基于关联规则的推荐算法,同一用户借阅的不同图书可以认为之间有着关联关系,从借阅信息中搜索关联度最高的图书集合可以作为图书推荐的重要参考,李默等人提出了一种基于标签和关联规则挖掘的图书组合推荐模型;三是基于协同过滤的算法,基于用户的协同过滤与项目无关,它寻找当前用户最相似的邻近用户,推荐邻近用户借阅的图书给当前用户。武建伟,俞晓红等人提出了一种基于密度的动态协同过滤图书算法;黄太波等人在数据量不同的情况下对不同的协同过滤算法进行了对比,何佶星等人提出了一种基于项目评分系统的流行度划分结合平均偏好权重的协同过滤推荐算法。此外,王鹏等人还提出了一种基于社会网络的图书推荐算法。
发明内容
相比其他图书推荐,高校读者图书推荐有其自身的特点和需求。首先,高校图书馆借阅量非常大,如果将每一个读者都加入到协同计算,计算效率太低;其次,高校图书馆还未拥有完善的读者评分系统,所以一般用于高校图书馆的协同过滤算法无法利用评分来衡量推荐度,仅仅只能使用读者个人信息之间的联系进行推荐;此外,高校图书团的馆藏图书专业性质更强。结合已有研究,本发明提出了一种基于兴趣度模型与类型因子的高校图书推荐方法,使用K近邻算法将读者聚类,减少计算量;建立了兴趣度模型来量化协同过滤;将类型因子加入到协同过滤计算过程中,提高了推荐的准确率。
为了解决上述技术问题本发明采用如下技术方案:
一种基于兴趣度模型与类型因子的高校图书推荐方法,该方法使用K近邻算法将读者聚类,减少计算量;建立了兴趣度模型来量化协同过滤;将类型因子加入到协同过滤计算过程中,提高了推荐的准确率,所述推荐方法包括以下步骤:
第一步,基于K近邻算法的读者聚类
采用K近邻算法将目标读者与其k个近邻读者聚类成一个只包含近距离数据的集合;
使用读者的借阅信息、专业、年级三个维度的相似度作为聚类的标准,如下:
1.1)借阅信息相似度
读者u和读者v借阅了相同的类型的图书数目越多,表明两者的相似度越高;设bo(u,i)表示读者u是否借阅了图书i,book(u)表示读者u所有借阅图书的集合,则:
用simr(u,v)表示读者u和读者v借阅相同书籍的数量,并以此作为两者在借阅信息特征方向的相似度:
其中,B表示所有图书集合。
1.2)专业相似度
读者u和读者v的专业相似度表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811154325.X/2.html,转载请声明来源钻瓜专利网。