[发明专利]一种基于数据挖掘技术的微博推荐方法及装置在审
申请号: | 201610109847.2 | 申请日: | 2016-02-26 |
公开(公告)号: | CN105574213A | 公开(公告)日: | 2016-05-11 |
发明(设计)人: | 施化吉;郝梓琳;周从华;刘志锋;朱小龙;陈伟鹤;徐宗保 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 江苏纵联律师事务所 32253 | 代理人: | 蔡栋 |
地址: | 212013 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 挖掘 技术 推荐 方法 装置 | ||
技术领域
本发明涉及计算机科学及网络技术领域,特别是涉及一种微博推荐方法的数 据挖掘技术。
背景技术
微博网站每天都会发布数据量非常之多的微博,尤其是大型网站的用户访问 量多达亿级别,而且信息更新速度非常快,对微博的时效性也有很高的要求。网 站针对这种情况,首要选择就是实施微博推荐,快速有效的找到用户感兴趣的微 博,获取用户想要了解的信息。
现有技术中,推荐方法主要分为三种:第一种是基于内容过滤,基于内容过 滤的推荐系统通过比较项(商品)之间的相似性而不是用户之间的相似性实现推 荐功能;第二种是基于协同过滤,基于协同过滤技术的电子商务推荐系统并不分 析商品之间的相似性,而是学习目标用户和历史用户之间行为的相似性,而不依 赖商品的特征,从而根据相似历史用户的行为生成推荐结果;第三种是混合型, 结合使用前面两种技术,尽量利用它们的优点而避免其缺点,提高推荐系统的性 能和推荐质量。
但是在上述现有技术中,基于内容过滤,只能考虑到微博的相似性而不能考 虑到微博的时效性,所以推荐效果不理想;基于协同过滤,必须是鉴于访问记录 而进行的推荐,对时效性要求较高的微博推荐而言,只推荐被访问过的热门微博, 故在协同过滤中,就会生成已过期的热门微博。
发明内容
本发明的目的在于提供一种基于数据挖掘技术的微博推荐方法及装置,克服 现有技术中针对微博上现有的大量微博信息不能有效合理地推荐给相关用户的 难题,,以实现能够通过数据挖掘技术,匹配相关类别的微博和用户,并根据相 关性给用户有效的推荐意见。
为了解决以上技术问题,本发明采用的具体技术方案如下:
一种基于数据挖掘技术的微博推荐方法,其特征在于包括以下步骤:
步骤一,将微博按照内容进行分类
通过KNN分类算法,将微博按照内容进行分类。按照内容可分为情感类、社 会类、明星类、财经类、体育类、科技类、军事类、教育类、游戏类;
步骤二,获取预置时间段内选定用户对各类微博的点击量,并根据各类微博 的该所述点击量,计算得到所述用户在所述时间段内的微博兴趣模型;
根据各类微博的所述点击量,通过贝叶斯全概率公式计算得到所述用户在所 述时间段内的微博兴趣模型。根据所述用户在所述时间段的微博兴趣模型,加权 平均计算得到所述用户在包含多个所述时间段的当天24小时的最终微博兴趣模 型;
步骤三,按照所述最终微博兴趣模型聚类所有用户,并根据所述最终微博兴 趣模型确定向聚类后的各类用户推荐的微博候选集;
将对微博的兴趣向量相似的用户聚成一个用户类,向属于同一个聚类的用户 推荐相同的微博,具体采用鉴于K均值算法的MapReduce模型实现用户聚类,根 据预置时间段内最终微博兴趣模型得到微博候选集;
步骤四,将所述微博候选集中的微博推荐给所述用户
将所述微博候选集中的微博按照一定的规则推荐给用户,根据用户兴趣标签 推荐相关类别的微博。规则为:在相关类别中,将所述微博候选集中的微博按照 权重值进行降序排列,并按照排列的先后顺序向所述用户推荐微博。
一种基于数据挖掘技术的微博推荐装置,其特征在于:包括微博分类模块, 兴趣建模模块,用户聚类模块,候选集确定模块,微博推荐模块;
所述微博分类模块,用于将微博按照内容进行分类;兴趣建模模块,获取预 置时间段内选定用户对各类微博的点击量,并根据各类微博的该所述点击量,计 算得到所述用户在所述时间段内的微博兴趣模型;用户聚类模块,用于按照所述 最终微博兴趣模型聚类各用户;候选集确定模块,根据所述最终微博兴趣模型确 定向聚类后的各类用户推荐的微博候选集;微博推荐模块,用于将所述微博候选 集中的微博推荐给所述用户。本发明的工作过程为:将发布微博按照内容在微博 分类模块中进行分类,获得微博类别;获取预置时间段内选定用户对各类微博的 点击量,并根据各类微博的该所述点击量,在兴趣建模模块中计算得到所述用户 在所述时间段内的微博兴趣模型;在用户聚类模块中将对微博的兴趣向量相似的 用户聚成一个用户类,向属于同一个聚类的用户推荐相同的微博;根据所述最终 微博兴趣模型,在候选集确定模块中确定向聚类后的各类用户推荐的微博候选 集;最后在微博推荐模块中将所述微博候选集中的微博推荐给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610109847.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于多层特征表示的实例级图像搜索方法
- 下一篇:一种信息存储方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置