[发明专利]一种网络评论分析方法及系统在审

专利信息
申请号: 201711212278.5 申请日: 2017-11-28
公开(公告)号: CN107992550A 公开(公告)日: 2018-05-04
发明(设计)人: 李孟歆;刘方卉竹;许可;张颖;侯静 申请(专利权)人: 沈阳建筑大学
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 北京高沃律师事务所11569 代理人: 王戈
地址: 110000 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 网络 评论 分析 方法 系统
【说明书】:

技术领域

发明涉及网络信息处理领域,特别是涉及一种网络评论分析方法及系统。

背景技术

在“互联网+”这个时代背景下,广大的网民已经不再是互联网信息的被动获取者,而是这些信息的主要制造者。人们可以足不出户、一键下单,购买全球各地的商品并对其做出评论、分享心得等。这些涌现在各种网络媒体中的海量信息,表达了用户的情感、观点和心情等主观性信息,而文本是其中的主要表现形式。这些海量的主观性文本数据蕴含的潜在价值是不可估量的。对于商业来说,可以通过整合消费者的评论来了解用户的需求,改变设计甚至是调整生产计划来增加利润;对于政府部门来说,可以通过分析热门事件的网络评论来知晓群众的意见,进而改善社会管理、及时处理社会问题等。如何高效地从这些海量的数据中提取出蕴含着社会和商业价值的信息,并且进一步地对这些信息做出精准的分析,这是当前自然语言处理领域的热门研究课题之一,文本情感分类技术正是针对这类问题应运而生。

传统的分类是以评论的投票比例作为分类依据,虽然投票比例非常直观的表达了人们对于该评论是否有帮助的想法,但是这个投票率并不是一个合格的标准,因为它需要时间来获取人们的选票。随着时间的推移,新评论与旧评论的投票数必然会产生变化,从而无法准确确定评价结果。

发明内容

本发明的目的是提供一种网络评论分析方法及系统,可提高网络评价的准确性。

为实现上述目的,本发明提供了如下方案:

一种网络评论分析方法,所述网络评论分析方法包括:

获取网络中的原始评论文本、所述原始评论文本的发表时间及获取时间;

对网络中的原始评论文本进行文本预处理,获得所述原始评论文本的词组集合;

从所述词组集合中提取所述原始评论文本的情感特征集;

根据所述原始评论文本的发表时间及获取时间,确定对应原始评论文本的权重;

基于支持向量机SVM分类器,根据所述原始评论文本的情感特征集及对应的权重,确定所述原始评论文本的置信度。

可选的,所述网络评论分析方法还包括:

预设多个置信度区间及对应的评论类别,所述评论类别包括有用好评、无用好评、有用差评及无用差评;

根据确定的置信度及对应的置信度区间,确定所述原始评论文本的评论类别。

可选的,所述对网络中的原始评论文本进行文本预处理,获得所述原始评论文本的词组集合,具体包括:

对所述原始评论文本进行分词处理,获得多个词语;

对各个词语进行词性标注;

删除词性标注后的各个词语中的停用词,剩余的词语构成所述原始评论文本的词组集合。

可选的,所述情感特征集包括情感词特征向量特征、实词特征。

可选的,从所述词组集合中提取所述原始评论文本的情感词特征向量特征,具体包括:

基于word2vec工具,计算所述词组集合中任意两个词语之间的相似度;

计算每个词语的相似度的平均值,各个词语的相似度平均值为情感词特征向量特征。

可选的,所述实词特征包括词语个数、句子个数、词语个数/句子个数、星星个数、非谓语形容词比例、副词比例、名词比例、限定词比例、程度词比例、介词比例、不及物动词比例、及物动词比例、正向性词汇个数、负向性词汇个数中至少一者。

可选的,所述根据所述原始评论文本的发表时间及获取时间,确定对应原始评论文本的权重,具体包括:

根据以下公式,计算原始评论文本的获取时间与发表时间的时间差值:

Δti=Ti1-Ti0

其中,i表示原始评论文本,Ti0表示原始评论文本i的发表时间,Ti1表示原始评论文本i的获取时间,Δti表示原始评论文本i的获取时间与发表时间的时间差值;

根据以下公式,确定原始评论文本的权重:

αi=1/Δti

其中,αi表示原始评论文本i的权重。

为实现上述目的,本发明提供了如下方案:

一种网络评论分析系统,所述网络评论分析系统包括:

获取单元,用于获取网络中的原始评论文本、所述原始评论文本的发表时间及获取时间;

预处理单元,用于对网络中的原始评论文本进行文本预处理,获得所述原始评论文本的词组集合;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳建筑大学,未经沈阳建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711212278.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top