[发明专利]一种汽车行业细分领域的情感分析方法及系统有效

专利信息
申请号: 201710896269.6 申请日: 2017-09-28
公开(公告)号: CN107704556B 公开(公告)日: 2020-04-24
发明(设计)人: 宋丹丹;洪煦;朱劲松;陈伟强 申请(专利权)人: 北京车慧科技有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F16/36
代理公司: 北京市维诗律师事务所 11393 代理人: 杨安进;徐永浩
地址: 100044 北京市海淀区西直门外大街16*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 汽车行业 细分 领域 情感 分析 方法 系统
【说明书】:

发明公开了一种汽车行业细分领域的情感分析方法及系统。该方法包括:获取汽车行业词典;根据用作训练素材的汽车行业的用户原创内容以及所述汽车行业词典训练情感分类器;根据所述汽车行业词典和/或所述情感分类器计算待评价的汽车行业的用户原创内容的情感分值。本发明通过构建汽车行业细分领域下的评价实体和情感词典,对于不同的细分领域基于各自的情感词典进行情感分值计算,而后对于情感词典未命中的情况下再通过机器学习的方式进行情感分值的计算,既解决了情感词典覆盖范围的缺陷,又一定程度上缓解了由于语料的不纯净造成分类器准确度下降的问题。

技术领域

本发明涉及大数据领域,尤其涉及一种汽车行业细分领域的情感分析方法及系统。

背景技术

随着互联网的快速发展,细分领域的网站越来越多,例如汽车、餐饮、住宿等服务的网站。很多用户在细分领域中,伴随着自己的实际经验,会针对自己的服务发表自己的观点。用户的反馈对产品或者服务提供者具有重要的意义,特别是追踪用户对产品或者服务的舆情走向以及对产品或服务的后续改进。

在汽车生活中,人们对于买车、用车过程中遇到的问题,往往也会在微博、论坛、贴吧等公共场合发表自己的意见,所以对于汽车企业来说,通过汽车舆情监测时刻关注用户对产品的评价及反馈,不但可以对可能出现的焦点事件进行提前干预及时处理,而且也可以搜集许多产品的优化改进建议。在汽车舆情系统中,往往可以通过对汽车行业相关网站或者论坛上目标用户发表的言论进行实时分析,获取用户针对产品所表达出的正负面情感倾向,从而达到对相关产品的舆情监测。

现有技术中主要依据情感词典,例如基础情感词典和汽车行业情感词典中的正负面情感词以及形容词等情感判别,或者基于机器学习的方法对文本进行正负面情感分类,从而得到用户原创内容的情感评价。

现有技术可以计算出情感分值,但存在如下问题:对汽车行业情感词典的广度有极高的要求,如果词典的覆盖范围较小,也就是正负面情感词远小于真实存在的情感词数量,这样很容易对帖子中的情感词漏判,从而降低帖子情感倾向判断的准确性;词典中同一个情感词在不同语境下有时会表达出完全相反的情感倾向,无法确定情感词的情感评价;现有技术非常笼统地为每篇帖子计算出一个分值,无法定位到对细节的情感评价。

发明内容

有鉴于此,本发明提供一种汽车行业细分领域的情感分析方法及系统,其目的在于实现汽车行业细分领域下的情感分析。

本发明提供了一种汽车行业细分领域的情感分析方法,该方法包括:

获取汽车行业词典;

根据用作训练素材的汽车行业的用户原创内容以及所述汽车行业词典训练情感分类器;

根据所述汽车行业词典和/或所述情感分类器计算待评价的汽车行业的用户原创内容的情感分值。

优选地,所述汽车行业词典包括细分领域的实体词典和细分领域的情感词典;其中,所述细分领域的实体词典为名词类词典,所述细分领域的情感词典为形容词类词典。

优选地,所述根据用作训练素材的汽车行业的用户原创内容以及所述汽车行业词典训练情感分类器包括:

根据所述细分领域的实体词典判断用作训练素材的汽车行业的用户原创内容所属细分领域;

生成用作训练素材的汽车行业的用户原创内容的词向量表达;

根据汽车口碑数据中最满意的评论和最不满意的评论生成带标签的训练数据;

计算用作训练素材的汽车行业的用户原创内容的句子向量,并训练该细分领域的情感分类器。

优选地,所述根据所述汽车行业词典和/或所述情感分类器计算待评价的汽车行业的用户原创内容的情感分值包括:

根据所述细分领域的实体词典确定待评价的汽车行业的用户原创内容所属细分领域;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京车慧科技有限公司,未经北京车慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710896269.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top