[发明专利]基于社区的作者及其学术论文推荐系统和推荐方法有效
申请号: | 201310537842.6 | 申请日: | 2013-11-04 |
公开(公告)号: | CN103559262A | 公开(公告)日: | 2014-02-05 |
发明(设计)人: | 卢美莲;王萌星;高洁;刘智超;秦臻 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 夏宪富 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于社区的作者及其学术论文的推荐系统和推荐方法,该系统先利用作者与论文的引用关系和社区信息构建由作者层和论文层组成的双层引用网络,然后,根据用户的历史行为记录和用户阅读过的论文集构建用户兴趣模型,最后根据得到的双层引用网络和用户兴趣模型,分析用户需求,向用户推荐作者及其论文。系统设有:论文抓取、预处理、双层引用网络构建、用户兴趣模型构建和个性化学术推荐五个模块和数据库。本发明系统既能利用作者间研究内容的相关性,通过主题模型构建作者社区;还能在社区内部计算待推荐的作者和论文的多种属性值,改善现有推荐算法计算量大的缺陷;同时计算作者和论文的多种属性值,使得推荐结果更多样化,更符合用户需求。 | ||
搜索关键词: | 基于 社区 作者 及其 学术论文 推荐 系统 方法 | ||
【主权项】:
一种基于社区的作者及其学术论文的推荐系统,其特征在于,该系统先利用作者与论文的引用关系和社区信息构建由作者层和论文层组成的双层引用网络,然后,根据用户的历史行为记录和用户阅读过的论文集构建用户兴趣模型,最后根据得到的双层引用网络和用户兴趣模型,分析用户需求,向用户推荐作者及其论文;该系统设有:论文抓取模块、预处理模块、双层引用网络构建模块、用户兴趣模型构建模块、个性化学术推荐模块和数据库;其中:论文抓取模块,负责采用网络爬虫抓取相关学科领域中每篇论文中包括标题、摘要、链接地址、作者标识ID、参考文献和发表时间的信息,将每篇论文使用该论文的链接地址用作唯一标识加以区分后,将抓取的论文全部信息都存储于数据库;预处理模块,负责从数据库中读取每篇论文的摘要,并由其分词、词性标注、词性过滤与停用词剔除四个单元依序分别对论文摘要进行处理后,得到论文摘要的分词序列;其中分词单元依据空格、标点符号对论文摘要进行分词,词性标注单元对分词后的论文摘要标注词性,词性过滤单元依据标注的词性提取名词,停用词剔除单元过滤和删除其中对该论文摘要没有实际意义的停用词,以节省存储空间和提高搜索效率;双层引用网络构建模块,负责从数据库读取论文的作者ID、参考文献和发表时间的信息,从预处理模块读取论文摘要的分词序列,并由其四个组成构件:基础网络构建单元、作者社区时间主题模型ACTTM模型训练单元、社区信息构建单元和节点属性值计算单元分别处理后,得到由作者层、论文层和两者之间的连接边组成的双层引用网络;其中ACTTM模型是在作者‑主题AT模型、时间主题TOT模型与社区主题模型CTM相互结合基础上提出的一个新主题模型;用户兴趣模型构建模块,负责读取数据库中的用户操作记录和论文的作者集合和发表时间信息,以及从预处理模块得到的论文摘要的分词序列,由其两个组成部件:用户兴趣社区集合构建单元和用户属性值计算单元分别进行相应处理后,生成用户兴趣模型;个性化学术推荐模块,负责读取用户兴趣模型构建模块构建的用户兴趣模型,得到每个用户的兴趣社区集合、用户权威值和用户多样值,再读取双层引用网络构建模块得到的社区作者列表、作者和论文间的著作关系、作者的属性值和论文的属性值,并经由其两个组成部件:作者推荐列表生成单元和论文推荐列表生成单元的处理,生成作者推荐列表和论文推荐列表;数据库,用于存储论文抓取模块抓取的所有论文的全部信息,包括:作为论文ID的链接地址、题目、摘要、发表时间和作者ID,所有用户对存储的该论文执行操作的全部行为记录,以及向用户最终推荐的作者推荐列表和论文推荐列表;每项操作的行为记录OR=(user_id,paper_id,event_id,time),其中,user_id为用户标识、paper_id为论文标识、event_id为操作内容,time为操作时间。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310537842.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种螺纹缺陷检测方法
- 下一篇:一种转子钢焊缝残余奥氏体的检测方法