[发明专利]一种个性化微博信息推荐系统和方法在审
申请号: | 201410074943.9 | 申请日: | 2014-03-03 |
公开(公告)号: | CN103778260A | 公开(公告)日: | 2014-05-07 |
发明(设计)人: | 张宇;宋巍;刘挺 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 杨立超 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种个性化微博信息推荐系统和方法,它涉及个性化信息推荐系统和方法,属于社交媒体信息服务技术领域。本发明要解决现有微博平台存在用户获取信息的质量与效率低、信息的有效传播速度较低的问题。本发明中一种个性化微博信息推荐系统,包括:微博特征抽取模块、用户兴趣模型模块、微博信息推荐模块、微博信息展示模块及数据模块。本发明中一种个性化微博信息推荐方法,主要包括以下几个步骤:a、用户访问系统时,获取当前实时的微博列表、用户的偏好及相关设置信息;b、抽取当前微博列表中每一条微博的统计、文本特征;c、按照微博信息推荐模块所述技术对用户获取的微博进行排序,将相关度大的微博优先排序。本发明适用于互联网交互与共享平台。 | ||
搜索关键词: | 一种 个性化 信息 推荐 系统 方法 | ||
【主权项】:
1.一种个性化微博信息推荐系统,其特征在于它包括:微博特征抽取模块(4)、用户兴趣模型模块(2)、微博信息推荐模块(5)、微博信息展示模块(7)和数据模块,其中:数据模块包括微博信息模块(3)、用户信息数据库(1)和用户浏览设置模块(6);微博特征抽取模块(4):根据用户历史信息与行为,对微博进行语义分析与建模,每一篇微博被表示为一个词向量的形式,记为Vd,其中每一个词具有一个权重,权重的计算公式为:weight ( w , d ) = tf ( w , d ) log N df ( w ) ]]> 其中,其中weight(w,d)表示微博d中词w的权重,tf(w,d)表示词w在微博d中出现的频率,df(w)表示词w出现在多少篇不同的微博中,N为微博的总数,df(w)和N的值都基于不断爬取的微博数据进行统计;用户兴趣模型模块(2):计算、存储能体现用户兴趣偏好的特征,并在预定时间内根据用户访问系统的行为更新相应用户的特征信息,用户模型为一个具有权重的词向量,记为Vu,其中每一个词的权重按照如下公式进行计算:weight ( w , u ) = tf ( w , u ) log M uf ( u ) ]]> 其中,其中weight(w,u)表示针对用户u中词w的权重,tf(w,u)表示词w在该用户发表过的所有微博中中出现的频率,uf(w)表示词w曾被多少个不同用户使用,M为微博用户的总数,同样,uf(w)和M的值都基于不采集的微博数据进行统计;微博信息推荐模块(5):根据当前实时微博列表及用户的特征信息,基于微博特征抽取模块与用户兴趣模型模块的输出,即微博模型与用户兴趣模型,进行相关度的计算,按照计算结果将微博列表排序,该模块内置多种个性化的推荐方式,并行计算结果;所述多种个性化的推荐方式分别为:方式1:圈中热语,将用户关注的用户中具有较大转发量的微博优先排序,每一个微博被赋予一个评分代表其优先级,计算公式为:p ( d | u ) = Σ f ∈ F p ( d | f ) p ( f | u ) ]]> 其中p(d|u)表示对于用户u微博d的打分,F为用户u关注的用户集合,p(d|f)表示用户u关注的一个用户f对微博d的打分,如果f发表、转发或评论了微博d,则将其置为1,否则置为0,p(f|u)为用户u对用户f的关注程度根据两者之间的交互频率计算,按照这一公式对所有微博候选进行由高到低排序推荐给用户;方式2:密友寻踪,将用户关注的用户按照交互频率进行排序,将排在前面的用户发表的微博优先显示;方式3:相似口味,计算用户模型Vu与微博模型Vd之间的相似度,计算方式如下:Sim ( V u , V d ) = V u · V d | V u | | V d | ]]> 即两个词向量的内积与它们各自模的乘积的比值,成为余弦相似度,根据公式
对所有的微博候选进行排序并推荐;微博信息展示模块(7):根据推荐模块中计算的排序结果,将微博信息呈现给用户;数据模块:用于数据的获取和储存,包括:微博信息模块(3):实时地获取、存储用户能接收到的所有微博信息;用户信息数据库(1):静态地存储微博用户的文本、社交方面信息;用户浏览设置模块(6):用户可自主地选择接收微博个性化推荐服务的方式。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410074943.9/,转载请声明来源钻瓜专利网。
- 上一篇:批量操作的管理方法和装置
- 下一篇:取代嘧啶类化合物及其用途
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置