[发明专利]基于微博的事件相似性度量方法及系统有效
申请号: | 201310529304.2 | 申请日: | 2013-10-30 |
公开(公告)号: | CN103530421B | 公开(公告)日: | 2017-01-04 |
发明(设计)人: | 邓镭;贾焰;邹鹏;杨树强;周斌;韩伟红;李爱平;韩毅;李莎莎 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京泛华伟业知识产权代理有限公司11280 | 代理人: | 王勇 |
地址: | 410073 湖南省长沙*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于微博的事件相似性度量方法。该方法构造指定微博的传播树,对传播树局部进行剪枝以克服博在转发过程中出现“话题漂移”。然后基于指定微博的传播树的词汇向量的相似度、传播树的关注用户集的相似度和/或传播树的时间相似度来获取所述两条原创微博所指示的事件相似度。该方法将微博的结构特征,事件的演化特征与传统的词汇概率特征相结合,建立了一种更适于度量微博事件的相似度计算模型将微博的结构特征,可以提高微博中事件相似性计算的准确度。对传播树局部进行剪枝是可选的,其主要是为了克服由于微博在转发过程中会逐渐出现“话题漂移”的对度量微博事件相似性的准确性及计算效率的影响。 | ||
搜索关键词: | 基于 事件 相似性 度量 方法 系统 | ||
【主权项】:
一种基于微博的事件相似性度量方法,包括以下步骤:步骤1,对于两条给定的原创微博中的每一条:获取在给定时刻前对该原创微博的所有转发和评论的微博,并以该原创微博为根节点,构造该原创微博的传播树;传播树中每个节点对应一条微博,传播树中的边代表微博间的转发/评论关系;步骤2,计算两条原创微博的传播树的关注用户集的相似度;所述传播树的关注用户集是传播树中每个节点对应的微博的作者所关注的用户的并集;步骤3,计算两条原创微博的传播树的词汇向量的相似度;所述传播树的词汇向量为传播树中每个节点对应的微博的词袋的并集;步骤4,基于原创微博的传播树的词汇向量的相似度、传播树的关注用户集的相似度和传播树的时间相似度中的任意两个相似度或基于上述的三个相似度来获取所述两条原创微博所指示的事件相似度;其中所述原创微博的传播树的时间相似度计算方式如下:假设原创微博s1和s2的传播树中最早的发帖时间,发表时间最晚的时间点,分别记为其中则两个传播树的时间相似度Simt为:若则Simt=0;若则若则
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310529304.2/,转载请声明来源钻瓜专利网。