[发明专利]基于主题的个性化研究方向推荐系统和推荐方法有效

专利信息
申请号: 201310396246.0 申请日: 2013-09-04
公开(公告)号: CN103425799A 公开(公告)日: 2013-12-04
发明(设计)人: 卢美莲;高洁;王萌星;秦臻;刘智超 申请(专利权)人: 北京邮电大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 夏宪富
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 主题 个性化 研究 方向 推荐 系统 方法
【说明书】:

技术领域

本发明涉及一种个性化研究方向推荐系统和推荐方法,确切的说,涉及一种针对用户行为进行基于主题的个性化研究方向推荐系统和推荐方法,属于数据挖掘和机器学习的技术领域。

背景技术

目前,随着互联网的快速发展,人们正处于一个信息爆炸的时代。面对现阶段的海量信息,如何实现信息的筛选和过滤成为衡量一个网络系统性能好坏的重要指标。每个具有良好用户体验的网络系统,都会对海量信息进行筛选与过滤,将用户最关注、最感兴趣的信息展现在用户面前。这样既大大增加了网络系统的工作效率和效果,也显著节省了用户自己筛选信息的时间。

搜索引擎的出现,在一定程度上解决了信息筛选问题,但是还远远不够。因为搜索引擎需要用户主动提供关键词,以此作为其对海量信息进行筛选的依据。当用户无法准确描述自己的需求时,搜索引擎的筛选效果就将大打折扣。然而,用户将自己的需求和意图转化成关键词的过程,其本身就是一个并不轻松的处理操作过程。故在此背景下,人们研制了推荐系统:其任务就是解决上述将用户和信息进行关联的问题:一方面帮助用户发现对自己有价值的信息,另一方面让信息能展现在对其感兴趣的人群中,从而实现信息提供商与用户的双赢。

在学术领域,每年发表有大量的论文、专利和会议集,根据中国科学技术信息研究所2011年底发布的统计数据,2010年美国发表SCI论文39.01万篇,排在世界第一位,中国发表SCI论文14.84万篇(含港澳地区),排在第二位。面对数量如此之多的学术论文,用户需要花费大量的时间才能找到自己所需要的信息。这种浏览大量无关信息的过程,无疑会使淹没在信息过载问题中的大量用户不断流失。在这种背景下,个性化学术推荐系统应运而生。个性化学术推荐系统是一个依据用户的行为等信息挖掘用户感兴趣的资源,并推荐给用户的网络系统。该系统采用用户与学术网站进行交互,学术网站通过分析用户的行为等信息,挖掘出用户感兴趣的学术资源,并自动推荐给用户,实现学术网站与用户的双赢。目前,应用较多的个性化学术推荐方法包括:

第一种是协同过滤的学术资源推荐算法,它又包含下述两种方法:

一是基于用户的协同过滤方法:其基本思想相当简单,基于用户对学术资源的偏好寻找其相似的邻居用户,然后将邻居用户喜欢的内容推荐给当前用户。其操作步骤为:

步骤1、先将一个用户对所有学术资源的偏好作为一个向量,用于计算用户之间的相似度,找到K邻居;

步骤2、根据邻居的相似度权重及其对学术资源的偏好,预测当前用户没有偏好或未涉及的学术资源,计算得到一个排序的学术资源列表作为推荐。

二是基于项目的协同过滤方法:其工作原理和基于用户的协同过滤方法类似,只是在计算其邻居时,采用学术资源本身,而不是从用户的角度,即基于用户对学术资源的偏好找到相似的学术资源,然后根据用户的历史偏好,向其推荐相似的学术资源。其操作步骤为:

步骤1,先将所有用户对某个学术资源的偏好作为一个向量,计算各个学术资源之间的相似度,得到每个学术资源的相似学术资源;

步骤2,根据用户的历史偏好,预测当前用户还没有表示偏好的学术资源,计算得到一个排序的学术资源列表作为推荐。

协同过滤的优点是:能够过滤难以进行内容分析的信息,如艺术品,音乐等。可以共享其他人的经验,还避免了内容分析的不完全和不精确,并且能够基于一些复杂的、难以描述的抽象概念(如信息质量、个人品味)进行过滤。具有推荐新信息的功能,可以发现内容上完全不相似的信息,且用户对推荐的内容也是其事先所没有预料到的。

虽然协同过滤作为一种典型的推荐技术有着很好的应用,但是,其也仍然存在许多问题有待解决。最典型的是:稀疏问题(Sparsity)和可扩展问题(Scalability)。

第二种是基于内容的学术用户推荐算法,其核心思想是根据学术资源内容的元数据,发现学术资源内容的相关性,然后基于用户以往的喜好记录,向用户推荐相似的学术资源。其操作步骤为:

步骤1、根据学术资源的内容,并结合用户的行为数据对用户进行建模;

步骤2、通过计算学术资源与目标用户之间的相似度,将相似度排名较高的学术资源推荐给目标用户。

基于内容的推荐方法能够很好地对用户的喜好进行建模,以便提供更精准的推荐。同时,由于推荐是根据学术资源的内容进行计算的,因此,不存在数据稀疏和冷启动问题,并且具有很好的可解释性。

综上所述,现在的学术推荐系统与推荐方法依然存在下述两个主要问题:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310396246.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top