[发明专利]一种微博中特定用户的相似用户监控方法在审
申请号: | 201510363990.X | 申请日: | 2015-06-26 |
公开(公告)号: | CN105045822A | 公开(公告)日: | 2015-11-11 |
发明(设计)人: | 仲兆满;管燕 | 申请(专利权)人: | 淮海工学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 连云港润知专利代理事务所 32255 | 代理人: | 刘喜莲 |
地址: | 222000 江苏省连云港市海*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 微博中 特定 用户 相似 监控 方法 | ||
技术领域
本发明涉及一种信息挖掘技术,具体地说,涉及一种微博中特定用户的相似用户监控方法。
背景技术
当今,社交媒体被认为是Web上最有价值的信息资源之一。微博作为众多社交媒体中的一种,由于其传播性强、操作便利,很多用户在微博形成了类似于现实社会的交往圈子。传统媒体用户和话题之间是二部网络,微博由于引入了关注和粉丝,使得用户和话题之间是多模网络。由于微博信息传播性强、具有复杂的网络结构,近几年引起了学术界和产业界的高度重视。
微博中的相似用户是指在微博媒体上具有若干共同属性的用户群,这些属性主要包括用户的背景、关注、粉丝、微博、交互等信息。社交媒体上用户的信息总体上分为两类:一类是用户的背景(比如地点、教育、职业、兴趣等)和发表的微博信息;另一类是基于关注和粉丝构建的社交网络。基于这两类信息,已有的用户相似度计算方法大体上可以分为三类:(1)基于用户的背景和微博信息的方法,简记为SUDByText;(2)基于关注和粉丝的社交网络的方法,简记为SUDBySN;(3)混合方法,即对方法SUDByText和SUDBySN的融合计算,简记为SUDByTSN。当前,SUDByTSN是主流的研究方法。
在2011年美国出版的会议论文集:2011年可视化信息通信-交互会议(Proceedingsof2011VisualInformationCommunication-InternationalSymposium),题目为:社交网络中基于兴趣的朋友发现和推荐(Sfviz:interest-basedfriendsexplorationandrecommendationinsocialnetworks),作者是:GouL,YouF,GuoJ,WuL,ZhangXL,该文提出了使用用户的社交标签及网络的拓扑结构计算用户的相似度,网络拓扑包括用户的关注和粉丝,没有利用访客类用户。
在2013年德国出版的期刊:UserModelingandUser-AdaptedInteraction,题目为:Exploringsocialtaggingforpersonalizedcommunityrecommendations,作者是:KimHN,SaddikAE,该文从一个用户出发,基于社交标签寻找到他感兴趣的社区。社区的社交标签通过社区成员的标签提取,包括成员的兴趣、情感、地理位置、时间等。
在2014年中国出版的期刊:中文信息学报,题目为:基于排序学习的微博用户推荐,作者是:彭泽环,孙乐,韩先培,石贝,该文在进行微博用户推荐时,利用了用户的微博、个人信息、交互信息、社交拓扑信息等四类因素,认为用户的交互信息对相似用户的推荐性能影响最大。
在2014年中国出版的期刊:计算机学报,题目为:微博用户的相似性度量及其应用,作者是:徐志明,李栋,刘挺,李生,王刚,袁树仑,该文在度量用户的相似度时,考虑了用户的背景信息、微博、社交和交互信息。以50个用户作为种子节点,爬取了1层关联的粉丝、关注类用户,并认为社交信息在计算用户的相似度时最有价值。
发明内容
本发明所要解决的技术问题是针对以上所述现有技术存在的问题和不足,提供一种微博媒体监控相似用户方法,该方法可以增加发现相似用户的全面性和多样性,提高发现相似用户的准确性。
本发明所要解决的技术问题是通过以下的技术方案来产现的。本发明是一种微博中特定用户的相似用户监控方法,其特点是,其步骤如下:
A、根据输入的特定用户su得到扩展自我网络EEN——ExtendedEgoNetwork的用户集,记为EEN(su)=FollowerCS(su)UFansCS(su)UVisitorCS(su),其中FollowerCS(su)为su的关注集,FansCS(su)为su的粉丝集,VisitorCS(su)为su的访客集;
其具体步骤如下:
A1、获取时间片TimeSpan内用户su的所有微博集MB-su,包括原创、转发、评论的微博;
A2、获取su的关注集FollowerCS(su)和粉丝集FansCS(su);
A3、根据su的微博集MB-su提取访客集VisitorCS(su),将三类用户记为EEN(su)=FollowerCS(su)UFansCS(su)UVisitorCS(su);
B、基于用户的关注、粉丝和动态微博的相似度,以及用户间的动态交互相互性,从EEN(su)中发现与su相似的用户集SimUser(su)íEEN(su),其具体步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮海工学院,未经淮海工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510363990.X/2.html,转载请声明来源钻瓜专利网。