[发明专利]一种社交消息的监测方法及装置在审
申请号: | 201410175434.5 | 申请日: | 2014-04-28 |
公开(公告)号: | CN105095228A | 公开(公告)日: | 2015-11-25 |
发明(设计)人: | 陈雷;周项敏;何秀强 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00;G06Q10/10 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 消息 监测 方法 装置 | ||
技术领域
本发明涉及通信领域,尤其涉及一种社交消息的监测方法及装置。
背景技术
近年来,社交媒体,如微博、微信、论坛、播客等,已经成为人们发布消息的重要途径。社交媒体的信息中往往包含着在事件发生过程中的各种重要资料和线索,通过消息及时发现和监控重大事件的发生及变化过程,能够提高对危机事件管理和决策的灵活性和实时性。
以新西兰昆士兰水灾为例,整个水灾过程从不同角度在Twitter(一种社交媒体的名称)上进行了实时呈现,例如发生了什么、在哪里发生、有谁参与、以及对周边环境的影响等。如下的事件都出现在Twitter上,“一艘游艇在布里斯班河正在沉没”、“港口重新开放”、“鲨鱼被冲到街道上”、“一些重要政府机构办公地区临时管制”等。及时发现上述事件对救灾及危机管理都有重大的意义。
现有的对社交消息进行发现的过程是:用户通过社交网客户端主动对社交消息进行查询、收集相关的社交事件。即对社交消息的获取需要通过人工输入的方式在社交网客户端中输入社交消息的基本信息,然后由浏览器或社交网客户端依据社交消息的基本信息搜索获取一个类别的社交消息。
在实现上述社交消息发现的过程中,由于对社交消息的获取是通过人工触发,这样社交网客户端并不能实现对社交消息的实时监测,因此社交网客户端不能主动发现互联网社交事件的更新。
发明内容
本发明的实施例提供一种社交消息的监测方法及装置,以实现对社交消息的实时监控,从而使社交网客户端能主动发现聚类的社交事件。
本发明的实施例采用如下技术方案:
第一方面,提供一种社交消息的监测方法,包括:
接收社交消息,并对所述社交消息进行主题建模分析,得到所述社交消息的主题概率向量;
将所述社交消息的主题概率向量与每个代表消息的主题概率向量进行比较得到主题相似性,并依据所述主题相似性获取所述社交消息与所述每个代表消息的相似性,其中,所述代表消息为一个消息类中具有代表性的社交消息;
将所述社交消息存入与所述社交消息相似性最高的代表消息所在的消息类中;
当所述消息类中的社交消息的数量达到第一阈值或所述消息类中的社交消息主题一致时,向社交网客户端输出所述消息类。
结合第一方面,在第一种可能的实现方式中,所述方法还包括:
若所述社交消息与所述每个代表消息的相似性均不超过预设的第一相似性阈值,则新建一个消息类,将所述社交消息存入所述新建的消息类。
结合第一方面或第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述方法还包括:
从每一个消息类中选取代表消息;
其中,所述从每一个消息类中选取代表消息包括:
在每一个消息类中选择预设的时间内的社交消息作为代表消息,其中,不同的消息类中预设的时间可以不相同;或
在所述每一个消息类中选择预设的地点内的社交消息作为代表消息,其中,不同的消息类中预设的地点可以不相同;或
在所述每一个消息类中选择预设的时间内和预设的地点内的社交消息作为代表消息,其中,不同的消息类中预设的时间和预设的地点可以不相同;或
将所述每一个消息类中的所有的社交消息的主题概率向量进行加权平均,得到所述每一个消息类的代表消息的主题概率向量,在每一个消息类中选取与所述消息类的代表消息的主题概率向量匹配的社交消息作为代表消息;其中,若有新的社交消息加入所述消息类,重新进行加权平均计算所述消息类的代表消息的主题概率向量。
结合第一方面或第一方面的第一种或第二种可能的实现方式,在第三种可能的实现方式中,所述接收社交消息,并对所述社交消息进行主题建模分析,得到所述社交消息的主题概率向量,包括:
接收所述社交消息,获取所述社交消息的内容参数、所述社交消息的时间参数、所述社交消息的空间参数;
利用隐含狄利克雷分布LDA算法对所述社交消息的内容参数、所述社交消息的时间参数、所述社交消息的空间参数进行主题建模分析,得到所述社交消息的主题概率向量。
结合第一方面或第一方面的第一种到第三种任一种可能的实现方式,在第四种可能的实现方式中,所述方法还包括:
对比所述社交消息的用户与所述每个代表消息的用户得到所述社交消息与所述每个代表消息的用户相似性;
将所述社交消息的主题概率向量与每个代表消息的主题概率向量进行比较得到主题相似性,并依据所述主题相似性获取所述社交消息与所述每个代表消息的相似性,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410175434.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据库的数据样本采集
- 下一篇:文本分类方法及服务器