[发明专利]基于话题转移熵的微博隐蔽关键用户分析方法有效
申请号: | 201810369630.4 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108536866B | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 尹美娟;刘晓楠;罗军勇;唐梓淇;何功震;朱玛;杨文 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/2458 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 话题 转移 隐蔽 关键 用户 分析 方法 | ||
1.一种基于话题转移熵的微博隐蔽关键用户分析方法,其特征在于,包含:
A)通过微博平均传播规模,获取显著关键用户及候选隐蔽关键用户;
B)抽取显著关键用户和候选隐蔽关键用户的微博话题序列;
C)计算候选隐蔽关键用户到显著关键用户的话题转移熵;
D)分析候选隐蔽关键用户的隐蔽重要度,识别隐蔽关键用户;
基于微博主题相似性和时序相关性获取隐蔽关键用户到显著关键用户的微博话题转移熵,度量前者对后者的隐蔽影响程度,并结合两者自身的直接影响力,评估隐蔽关键用户隐蔽重要度,实现微博隐蔽关键用户的准确识别;
A)中获取显著关键用户及候选隐蔽关键用户,包含如下内容:
A1)通过微博显式转发次数计算用户直接影响力;
A2)根据用户直接影响力排名,提取显著关键用户;
A3)抽取显著关键用户所关注用户,作为隐蔽关键用户初始候选集;
A4)根据用户直接影响力筛选初始候选集,过滤掉直接影响力排名在前10%的用户,其余用户构成隐蔽关键用户候选集;
A1)中用户u的直接影响力Influenceu的计算公式表示为:
其中,Repostnumi表示用户u第i个微博的显式转发次数,WeiboNum表示用户u发布微博的总数。
2.根据权利要求1所述的基于话题转移熵的微博隐蔽关键用户分析方法,其特征在于,还包含:数据预处理步骤,根据微博用户及微博特征,过滤僵尸用户和广告账户及两者的相关微博,并过滤传播层数小于两层的微博。
3.根据权利要求1所述的基于话题转移熵的微博隐蔽关键用户分析方法,其特征在于,B)中抽取显著关键用户和候选隐蔽关键用户的微博话题序列,包含:
B1)通过LDA三层贝叶斯网络模型分析用户微博文本,得到用户微博话题分布向量;
B2)对微博时间序列内每个时间段上的微博话题分布向量进行聚类,得到微博簇;
B3)获取相邻时间段的微博话题相似度,并根据设定阈值和微博话题相似度合并相邻时间段内发布的微博话题。
4.根据权利要求3所述的基于话题转移熵的微博隐蔽关键用户分析方法,其特征在于,B3)中获取相邻时间段TnTn+1的微博话题相似度TopicSimn,n+1,其计算公式表示为:
,其中,k表示用户微博话题分布向量中元素个数,1≤n≤k-1,表示时间段Tn用户微博话题i。
5.根据权利要求1所述的基于话题转移熵的微博隐蔽关键用户分析方法,其特征在于,C)中计算候选隐蔽关键用户到显著关键用户的话题转移熵,包含如下内容:
C1)构造微博时间序列上显著关键用户和候选隐蔽关键用户两者的事件集合,微博时间序列为预设的包含多个时间段的时间区间;
C2)分别计算候选隐蔽关键用户到显著关键用户的微博话题转移熵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810369630.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:跨平台大数据信息智能采集方法
- 下一篇:用于生成信息的方法和装置