[发明专利]一种评价热点事件价值度的方法在审
申请号: | 201810694422.1 | 申请日: | 2018-06-29 |
公开(公告)号: | CN109255015A | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 黄泽文;程国艮 | 申请(专利权)人: | 中译语通科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/338;G06F16/953 |
代理公司: | 北京睿驰通程知识产权代理事务所(普通合伙) 11604 | 代理人: | 张文平 |
地址: | 100040 北京市石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 价值度 维度 权重分配 热点事件 预警 算法分析 预警级别 输出 | ||
本发明提供了一种评价热点事件价值度的方法,它包括:确定评价热点事件价值度的维度;按照各个维度的重要程度确定维度之间的权重分配;按照各个维度的重要程度确定维度之间的权重分配;利用上述各个维度的输出值及权重分配值,建立算法分析模型进行计算得到事件价值度。并且根据所得到的事件价值度以及设定的舆情价值预警体系,将上述事件价值度与舆情价值预警体系进行对比,最终得到不同事件的预警级别。
技术领域
本发明涉及一种热点事件价值度评价方法,具体而言涉及一种采用不同维度的指标对事件价值度进行辅助计算的方法。
背景技术
热点事件普遍是指在某个时间段内社会中引起广泛关注、参与讨论、激起民众情绪,引发强烈反响的事件,通俗点说就是被很多人熟知且讨论的事件统称为热点事件。现在网络上主流的热点事件大部分都是通过人工筛选获取的。
然而,在信息化的时代,网络信息的数据量成几何级增长,而且由于网络中言论的自由化,虚拟化,导致网络信息真假难辨,鱼龙混杂,此外网络中的信息传播速度快,受众量大,传播范围广,尤其是近年来出现的微信,微博等新兴传媒形式,具有内容简短,参与发言人数众多,话题随意性强等特征。这些网络媒体所具有的特征导致人工识别和研判显得力不从心,如何利用计算机网络技术、人工智能技术和数据挖掘技术自动的检测和挖掘热点事件成为一个重要的研究课题。
目前有关话题事件的研究的工作主要集中于两类方法:一种是基于传统向量,空间话题模型的话题演化挖掘,通过将文档的时间信息作为话题属性引入到话题特征计算,进而构建具有动态演变性的话题模型;另一种方法则是在概率话题模型的基础上,通过计算时间信息与话题、文档、词项的后验概率分布完成对话题事件的内容检测和挖掘。
发明内容
本发明通过不同媒体类型的价值,以及媒体之间权重的跳跃性,从海量信息中抽取出潜在热点新闻数据,可以为我们的新闻热点平台提供较好的数据支撑。为此定义了综合媒体权重、媒体频道权重、版面位置权重、转载量、媒体跨越梯度权重这五个维度来进行辅助计算热点价值度。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
本发明提供了一种评价热点事件价值度的方法,其特征在于,该方法包括如下步骤:
(1)确定评价热点事件价值度的维度,所述维度根据不同媒体类型及媒体之间权重的跳跃性确定,具体为:媒体权重、媒体频道权重、版面位置权重、转载量、以及媒体跨越梯度权重;
(2)按照各个维度的重要程度确定维度之间的权重分配;
(3)针对每个维度建立计算模型,得到各个维度的输出值;
(4)利用上述各个维度的输出值及权重分配值,建立算法分析模型进行计算得到事件价值度。
优选地,所述媒体权重的权重分配是依据Alexa排名得到的,根据 Alexa排名将媒体权重分为10个等级,媒体权重最终得分记为W1。
优选地,所述媒体频道权重的权重分配是根据报道在网站中所处的位置确定的:
报道处于首页:媒体频道权重记为N;
报道处于通过首页可访问到的频道页中:媒体频道权重记为N- 20;
报道处于三级栏目位置:媒体频道权重记为N-40;
报道处于深度在三级以上的位置:媒体频道权重记为N-40-深度,其中,所述深度为报道距离首页的深度;
其中N为设定的针对同一网站的媒体频道权重最大值,为自然数;最后确定的媒体频道权重最终值记为W2。
优选地,所述版面位置权重的权重分配按照如下方法确定:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中译语通科技股份有限公司,未经中译语通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810694422.1/2.html,转载请声明来源钻瓜专利网。