[发明专利]一种微博中特定用户的相似用户监控方法在审
申请号: | 201510363990.X | 申请日: | 2015-06-26 |
公开(公告)号: | CN105045822A | 公开(公告)日: | 2015-11-11 |
发明(设计)人: | 仲兆满;管燕 | 申请(专利权)人: | 淮海工学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 连云港润知专利代理事务所 32255 | 代理人: | 刘喜莲 |
地址: | 222000 江苏省连云港市海*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 微博中 特定 用户 相似 监控 方法 | ||
1.一种微博中特定用户的相似用户监控方法,其特征在于,其步骤如下:
A、根据输入的特定用户su得到扩展自我网络EEN——ExtendedEgoNetwork的用户集,记为EEN(su)=FollowerCS(su)UFansCS(su)UVisitorCS(su),其中FollowerCS(su)为su的关注集,FansCS(su)为su的粉丝集,VisitorCS(su)为su的访客集;
其具体步骤如下:
A1、获取时间片TimeSpan内用户su的所有微博集MB-su,包括原创、转发、评论的微博;
A2、获取su的关注集FollowerCS(su)和粉丝集FansCS(su);
A3、根据su的微博集MB-su提取访客集VisitorCS(su),将三类用户记为EEN(su)=FollowerCS(su)UFansCS(su)UVisitorCS(su);
B、基于用户的关注、粉丝和动态微博的相似度,以及用户间的动态交互相互性,从EEN(su)中发现与su相似的用户集SimUser(su)íEEN(su),其具体步骤如下:
B1、获取每个用户在时间片TimeSpan内的微博集MB-useri、关注集FollowerCS(useri)、粉丝集FansCS(useri);
B2、计算用户su与的动态微博相似度,记为MBSim(su,useri),其中,Tj为某个时间片,Tj-T1的计算结果为时间片相差个数,l为指数衰减参数,用户useri在Tj时间片的微博向量化表示为:其中,为特征项权重,使用TF*IDF方式计算,在时间片Tj两个用户su,useri的微博相似度使用余弦夹角方式计算:
B3、计算用户su与的动态交互相关性,记为RC(su,useri),其中,Tj为某个时间片,Tj-T1的计算结果为时间片相差个数,l为指数衰减参数,在时间片Tj两个用户su,useri的交互相关性为他们的交互次数,记为m个时间片的最大交互次数记为RCmax,以RCmax为参考对用户的交互相关性进行归一化:
B4、计算用户su与的关注相似度,记为FollowerSim(su,useri),
B5、计算用户su与的粉丝相似度,记为FansSim(su,useri),
B6、最终得到用户su与的相似度Sim(su,useri),
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮海工学院,未经淮海工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510363990.X/1.html,转载请声明来源钻瓜专利网。