[发明专利]一种基于数据挖掘技术的微博推荐方法及装置在审

专利信息
申请号: 201610109847.2 申请日: 2016-02-26
公开(公告)号: CN105574213A 公开(公告)日: 2016-05-11
发明(设计)人: 施化吉;郝梓琳;周从华;刘志锋;朱小龙;陈伟鹤;徐宗保 申请(专利权)人: 江苏大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 江苏纵联律师事务所 32253 代理人: 蔡栋
地址: 212013 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 挖掘 技术 推荐 方法 装置
【说明书】:

技术领域

发明涉及计算机科学及网络技术领域,特别是涉及一种微博推荐方法的数 据挖掘技术。

背景技术

微博网站每天都会发布数据量非常之多的微博,尤其是大型网站的用户访问 量多达亿级别,而且信息更新速度非常快,对微博的时效性也有很高的要求。网 站针对这种情况,首要选择就是实施微博推荐,快速有效的找到用户感兴趣的微 博,获取用户想要了解的信息。

现有技术中,推荐方法主要分为三种:第一种是基于内容过滤,基于内容过 滤的推荐系统通过比较项(商品)之间的相似性而不是用户之间的相似性实现推 荐功能;第二种是基于协同过滤,基于协同过滤技术的电子商务推荐系统并不分 析商品之间的相似性,而是学习目标用户和历史用户之间行为的相似性,而不依 赖商品的特征,从而根据相似历史用户的行为生成推荐结果;第三种是混合型, 结合使用前面两种技术,尽量利用它们的优点而避免其缺点,提高推荐系统的性 能和推荐质量。

但是在上述现有技术中,基于内容过滤,只能考虑到微博的相似性而不能考 虑到微博的时效性,所以推荐效果不理想;基于协同过滤,必须是鉴于访问记录 而进行的推荐,对时效性要求较高的微博推荐而言,只推荐被访问过的热门微博, 故在协同过滤中,就会生成已过期的热门微博。

发明内容

本发明的目的在于提供一种基于数据挖掘技术的微博推荐方法及装置,克服 现有技术中针对微博上现有的大量微博信息不能有效合理地推荐给相关用户的 难题,,以实现能够通过数据挖掘技术,匹配相关类别的微博和用户,并根据相 关性给用户有效的推荐意见。

为了解决以上技术问题,本发明采用的具体技术方案如下:

一种基于数据挖掘技术的微博推荐方法,其特征在于包括以下步骤:

步骤一,将微博按照内容进行分类

通过KNN分类算法,将微博按照内容进行分类。按照内容可分为情感类、社 会类、明星类、财经类、体育类、科技类、军事类、教育类、游戏类;

步骤二,获取预置时间段内选定用户对各类微博的点击量,并根据各类微博 的该所述点击量,计算得到所述用户在所述时间段内的微博兴趣模型;

根据各类微博的所述点击量,通过贝叶斯全概率公式计算得到所述用户在所 述时间段内的微博兴趣模型。根据所述用户在所述时间段的微博兴趣模型,加权 平均计算得到所述用户在包含多个所述时间段的当天24小时的最终微博兴趣模 型;

步骤三,按照所述最终微博兴趣模型聚类所有用户,并根据所述最终微博兴 趣模型确定向聚类后的各类用户推荐的微博候选集;

将对微博的兴趣向量相似的用户聚成一个用户类,向属于同一个聚类的用户 推荐相同的微博,具体采用鉴于K均值算法的MapReduce模型实现用户聚类,根 据预置时间段内最终微博兴趣模型得到微博候选集;

步骤四,将所述微博候选集中的微博推荐给所述用户

将所述微博候选集中的微博按照一定的规则推荐给用户,根据用户兴趣标签 推荐相关类别的微博。规则为:在相关类别中,将所述微博候选集中的微博按照 权重值进行降序排列,并按照排列的先后顺序向所述用户推荐微博。

一种基于数据挖掘技术的微博推荐装置,其特征在于:包括微博分类模块, 兴趣建模模块,用户聚类模块,候选集确定模块,微博推荐模块;

所述微博分类模块,用于将微博按照内容进行分类;兴趣建模模块,获取预 置时间段内选定用户对各类微博的点击量,并根据各类微博的该所述点击量,计 算得到所述用户在所述时间段内的微博兴趣模型;用户聚类模块,用于按照所述 最终微博兴趣模型聚类各用户;候选集确定模块,根据所述最终微博兴趣模型确 定向聚类后的各类用户推荐的微博候选集;微博推荐模块,用于将所述微博候选 集中的微博推荐给所述用户。本发明的工作过程为:将发布微博按照内容在微博 分类模块中进行分类,获得微博类别;获取预置时间段内选定用户对各类微博的 点击量,并根据各类微博的该所述点击量,在兴趣建模模块中计算得到所述用户 在所述时间段内的微博兴趣模型;在用户聚类模块中将对微博的兴趣向量相似的 用户聚成一个用户类,向属于同一个聚类的用户推荐相同的微博;根据所述最终 微博兴趣模型,在候选集确定模块中确定向聚类后的各类用户推荐的微博候选 集;最后在微博推荐模块中将所述微博候选集中的微博推荐给用户。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610109847.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top