[发明专利]一种基于回归分析的新闻竞争力分析方法及其可视化装置有效
申请号: | 201510508730.7 | 申请日: | 2015-08-18 |
公开(公告)号: | CN105373579B | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 于瑞国;黄才宝;喻梅;王建荣;于健;赵满坤 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 回归 分析 新闻 竞争力 方法 及其 可视化 装置 | ||
本发明公开了一种基于回归分析的新闻竞争力分析方法及其可视化装置,方法包括:通过零和博弈与新闻事件发展趋势增长率,获取基于新闻事件发展趋势增长率的竞争力模型;将竞争力模型进行多元回归分析,扩展成一个多元回归模型;通过半偏相关系数评测新闻事件间的竞争力,并对竞争力进行量化;多元回归模型通过计算竞争力模型的拟合程度,对竞争力模型进行评估。装置包括:获取模块、扩展模块、评测及量化模块以及评估模块。本发明实现了对新闻数据的分析,且通过实验验证了本发明具有较高的拟合程度。本发明适用于新闻媒体上新闻事件竞争力的可视化分析。
技术领域
本发明涉及数据挖掘、信息检索和数据可视化领域,尤其涉及一种基于回归分析的新闻竞争力分析方法及其可视化装置。
背景技术
目前在数据可视化技术中,主要分为两大方面。一是社交媒体的可视化,马库斯等研究人员发明了TwitInfo来自动检测和显示微博活动高峰;Dork等研究人员介绍了基于web的系统提供一个可视化的技术来总结大型Twitter数据流,其运用了集群来减少数据的复杂性以便分析。Gansner提出一种文本流的可视化方法,它通过使用多尺度云在微博上建立主题云模型,来显示主题的变化趋势。
上述技术都是专注于将社交媒体上的一个事件的扩散过程给可视化出来,却难以可视化出多个在传播中的话题。
另一个相关技术是时态数据的可视化。目前,有许多不同的方式来处理分析时态数据,并将它们可视化出来。相关研究人员为了将时态多元数据很好的可视化出来,在原可视化技术上进行了扩展,例如:提出了平行坐标法等。在平行坐标法中,时间常被作为横轴,或者通过周期性的模式突显出来,将相同时间序列的数据聚合起来,便于可视化大量的时态数据。但其模式过于单一,需要与实际分析相结合进行扩展。
发明内容
本发明提供了一种基于回归分析的新闻竞争力分析方法及其可视化装置,本发明利用可视化技术将新闻事件间复杂的协同竞争关系给展示出来,便于分析人员对新闻的分析,详见下文描述:
一种基于回归分析的新闻竞争力分析方法,所述方法包括以下步骤:
通过零和博弈与新闻事件发展趋势增长率,获取基于新闻事件发展趋势增长率的竞争力模型;
将竞争力模型进行多元回归分析,扩展成一个多元回归模型;
通过半偏相关系数评测新闻事件间的竞争力,并对竞争力进行量化;
多元回归模型通过计算竞争力模型的拟合程度,对竞争力模型进行评估。
其中,所述方法还包括;对新闻数据进行分词、统计词频的预处理。
其中,所述将竞争力模型进行多元回归分析,扩展成一个多元回归模型的步骤具体为:
将竞争力模型整合成一个线性回归方程,使得自变量与因变量成线性关系,然后将影响因子矩阵的估计转变成对于多元回归模型的参数估计,通过最小二乘法求解参数。
其中,所述方法还包括;使用ThemeRiver模型将量化后的竞争力、以及新闻自身的发展趋势与主题,以可视化的方式展示出来,建立可视化模型。
一种基于回归分析的新闻竞争力分析的可视化装置,所述可视化装置包括:
获取模块,用于通过零和博弈与新闻事件发展趋势增长率,获取基于新闻事件发展趋势增长率的竞争力模型;
扩展模块,用于将竞争力模型进行多元回归分析,扩展成一个多元回归模型;
评测及量化模块,用于通过半偏相关系数评测新闻事件间的竞争力,并对竞争力进行量化;
评估模块,用于多元回归模型通过计算竞争力模型的拟合程度,对竞争力模型进行评估。
其中,所述可视化装置还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510508730.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据自分类存储方法及终端
- 下一篇:页面生成方法及客户端