[发明专利]基于话题转移熵的微博隐蔽关键用户分析方法有效
申请号: | 201810369630.4 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108536866B | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 尹美娟;刘晓楠;罗军勇;唐梓淇;何功震;朱玛;杨文 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/2458 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 话题 转移 隐蔽 关键 用户 分析 方法 | ||
本发明涉及一种基于话题转移熵的微博隐蔽关键用户分析方法,包含:通过微博平均传播规模度量微博用户的直接影响力,根据直接影响力发现显著关键用户和候选隐蔽关键用户;抽取两类用户的微博话题序列;计算候选隐蔽关键用户到显著关键用户的话题转移熵,度量候选隐蔽关键用户对显著关键用户的影响程度;基于候选隐蔽关键用户和显著关键用户的直接影响力、前者对后者的影响程度,分析候选隐蔽关键用户的隐蔽重要度,识别隐蔽关键用户。本发明基于微博主题相似性和时序相关性获取非显著关键用户到显著关键用户的微博话题转移熵,度量前者对后者的隐蔽影响程度,并结合两者自身的直接影响力,评估用户隐蔽重要性,实现微博隐蔽关键用户的准确识别。
技术领域
本发明属于网络数据挖掘技术领域,特别涉及一种基于话题转移熵的微博隐蔽关键用户分析方法,用于准确识别微博网络中隐蔽关键用户。
背景技术
微博是个庞大的社交媒体,同时也是海量舆论的集散地。对微博中信息的传播与扩散起到重要作用的用户,称为微博关键用户。分析微博中用户对信息传播的影响力,发现关键用户,对于微博的舆论监管与引导工作具有重要意义。微博中的关键用户分析是近几年的研究热点,目前的方法主要有:在给定传播模型参数的条件下,寻找使得微博传播扩散规模最大的种子用户集合作为关键用户;基于评论关系构建网络,结合用户兴趣,通过PageRank算法的变体识别意见领袖;根据主题URL构造转发级联树,预测用户发布的微博的平均传播规模,作为用户社会影响力大小的度量指标,进而判定关键用户;结合用户转发行为特征和用户中微博好友关系网络中的位置两个方面,度量用户的信息传播能力,来发现关键用户。但上述大多依赖微博系统自动标注的转发关系来分析微博用户的影响力,这种影响力是比较直接、明显的,发现的是重要性比较明显的关键用户,称为“显著关键用户”。而存在一些重要性比较隐蔽的关键用户,如炒作微博的幕后操控者,其对微博信息的传播具有非常重要的作用,但从微博的直接转发等行为上难以发现此类用户。将对微博中的传播或扩散具有重要作用,但其重要性较为隐蔽的用户,称为“隐蔽关键用户”。现有方法不适用于分析这种重要性隐蔽的关键用户的影响力,因此对隐蔽关键用户的识别度较低。
发明内容
针对现有技术中的不足,本发明提供一种基于话题转移熵的微博隐蔽关键用户分析方法,基于微博主题相似性和时序相关性获取非显著关键用户到显著关键用户的微博话题转移熵,度量前者对后者的隐蔽影响程度,并结合两者自身的直接影响力,评估用户隐蔽重要性,从而实现微博隐蔽关键用户的准确识别,对微博舆论监督与引导具有重要意义。
按照本发明所提供的设计方案,一种基于话题转移熵的微博隐蔽关键用户分析方法,包含:
A)通过微博平均传播规模,获取显著关键用户及候选隐蔽关键用户;
B)抽取显著关键用户和候选隐蔽关键用户的微博话题序列;
C)计算候选隐蔽关键用户到显著关键用户的话题转移熵;
D)分析候选隐蔽关键用户的隐蔽重要度,识别隐蔽关键用户。
上述的,在获取显著关键用户及候选隐蔽关键用户前,首先进行数据预处理,根据微博用户及微博特征,过滤僵尸用户和广告账户及两者的相关微博,并过滤传播层数小于两层的微博。
上述的,A)中获取显著关键用户及候选隐蔽关键用户,包含如下内容:
A1)通过微博显示转发次数计算用户直接影响力;
A2)根据用户直接影响力排名,提取显著关键用户;
A3)抽取显著关键用户所关注用户,作为隐蔽关键用户初始候选集;
A4)根据用户直接影响力筛选初始候选集,得到包含候选隐蔽关键用户的候选集。
优选的,A1)中用户u的直接影响力Influenceu的计算公式表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810369630.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:跨平台大数据信息智能采集方法
- 下一篇:用于生成信息的方法和装置