[发明专利]一种基于时间流的计算新闻事件动态影响力的方法与系统在审
申请号: | 201610625873.0 | 申请日: | 2016-08-02 |
公开(公告)号: | CN106156364A | 公开(公告)日: | 2016-11-23 |
发明(设计)人: | 陈雁;韩修龙;代臻;李平;孙先;胡栋;赵刚;郭培伦;彭欣宇;陈凯琪;杨先凤;朱鹏军;刘婷 | 申请(专利权)人: | 西南石油大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610500 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于时间流的计算新闻事件动态影响力的方法与系统,从不同的新闻网站获取对同一事件的报道,并且同时获取每个网站对该事件的浏览量、评论量以及对应的浏览、评论时间,报道该事件的网站的等级,以及对应事件的类别。依据给出的数据,计算每个事件基于时间流的动态影响力。由于此方法中的需求数据容易获取,相比于其他计算事件影响力的方法,在实施方式上非常的简单,实施效率也非常的高,并且选取的数据不仅非常的合理而且计算的方式也非常的易于理解。 | ||
搜索关键词: | 一种 基于 时间 计算 新闻 事件 动态 影响力 方法 系统 | ||
【主权项】:
一种基于时间流的计算新闻事件动态影响力的方法,其特征在于:该方法包括以下步骤,S1.确定需要抓取的目标新闻网站;S2.从权威的网站等级评价处获取目标网站的综合排名,并且将网站的排名单独建一个表存放在数据库中,将目标新闻网站的等级作为新闻事件的一个特征;S3.爬取目标网站的新闻事件,将爬取的新闻事件建立相对应的表并将数据存放在数据库中;S4.从数据库中取出爬取的新闻事件并进行相关停用词的去除,清洗掉与新闻事件无关的信息;S5.对清洗后的每个网站的每个新闻事件进行编号,并进行相同事件的聚类,得到相同事件的列表和报道该新闻事件的网站;S6.获取相同事件列表后,确定计算新闻事件动态影响力的时间段T;S7.确定获取的新闻事件的类别,将新闻事件的类别作为新闻事件的一个特征;S8.从数据库中获取相同事件列表中每个事件在时间段T内对应的评论数、浏览数、评论时间、浏览时间和该时间段中报道该事件的网站对应的评论数、浏览数、评论时间、浏览时间;将时间段T内的该网站浏览该新闻事件的数量与该时间段T内该网站的总的浏览数量的比值作为新闻事件的一个特征,将时间段T内的该网站评论该新闻事件的数量与该时间段T内该网站的总的评论数量的比值作为新闻事件的一个特征;S9.确定新闻事件每个特征对应的权重;S10.按照特征对应的权重计算新闻事件的动态影响力,计算公式如下:![]()
其中,n为网站数目,n个网站归一化后的权重为rank1,rank2…rankn,Cm为时间类别对应的权重,其中m为1、2、3其中的一个,选取的时间段T为一天,在这一天的时间段中,n个网站对该事件在一天时间段内的评论量及浏览量分别为(comment1,browse1)、(comment2,browse2)…(commentn,browsen),对应的该网站在该时间段总的评论量及浏览量为(allcomment1,allbrowse1)、(allcomment2,allbrowse2)…(allcommentn,allbrowsen)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学,未经西南石油大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610625873.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于XFS文件系统数据的重组恢复方法
- 下一篇:微型贴装整流半导体器件