[发明专利]一种基于数据挖掘技术的微博推荐方法及装置在审
申请号: | 201610109847.2 | 申请日: | 2016-02-26 |
公开(公告)号: | CN105574213A | 公开(公告)日: | 2016-05-11 |
发明(设计)人: | 施化吉;郝梓琳;周从华;刘志锋;朱小龙;陈伟鹤;徐宗保 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 江苏纵联律师事务所 32253 | 代理人: | 蔡栋 |
地址: | 212013 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于数据挖掘技术的微博推荐方法及装置,包括:将微博按照内容进行分类;获取预置时间段内选定用户对各类微博的点击量,并根据各类微博的该所述点击量,计算得到所述用户在时间段内的微博兴趣模型;按照所述最终微博兴趣模型聚类各用户,并根据所述最终微博兴趣模型确定向聚类后的各类用户推荐的微博候选集;将所述微博候选集中的微博推荐给所述用户。通过上述方法,本发明能够在错综复杂的微博信息中,对微博进行分类和排序,对用户进行聚类,根据分析结果,最后针对不同特征的用户群体推荐相应的感兴趣的微博。本发明可应用于微博网站及时准确的向用户推荐感兴趣的热门微博。 | ||
搜索关键词: | 一种 基于 数据 挖掘 技术 推荐 方法 装置 | ||
【主权项】:
一种基于数据挖掘技术的微博推荐方法,其特征在于包括以下步骤:步骤一,将微博按照内容进行分类通过KNN分类算法,将微博按照内容进行分类。按照内容可分为情感类、社会类、明星类、财经类、体育类、科技类、军事类、教育类、游戏类;步骤二,获取预置时间段内选定用户对各类微博的点击量,并根据各类微博的该所述点击量,计算得到所述用户在所述时间段内的微博兴趣模型;根据各类微博的所述点击量,通过贝叶斯全概率公式计算得到所述用户在所述时间段内的微博兴趣模型。根据所述用户在所述时间段的微博兴趣模型,加权平均计算得到所述用户在包含多个所述时间段的当天24小时的最终微博兴趣模型;步骤三,按照所述最终微博兴趣模型聚类所有用户,并根据所述最终微博兴趣模型确定向聚类后的各类用户推荐的微博候选集;将对微博的兴趣向量相似的用户聚成一个用户类,向属于同一个聚类的用户推荐相同的微博,具体采用鉴于K均值算法的MapReduce模型实现用户聚类,根据预置时间段内最终微博兴趣模型得到微博候选集;步骤四,将所述微博候选集中的微博推荐给所述用户将所述微博候选集中的微博按照一定的规则推荐给用户,根据用户兴趣标签推荐相关类别的微博;规则为:在相关类别中,将所述微博候选集中的微博按照权重值进行降序排列,并按照排列的先后顺序向所述用户推荐微博。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610109847.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于多层特征表示的实例级图像搜索方法
- 下一篇:一种信息存储方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置