[发明专利]基于深度学习的旅游景点评论情感分析方法在审
申请号: | 202110884900.7 | 申请日: | 2021-08-03 |
公开(公告)号: | CN113591487A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 蒋金亮 | 申请(专利权)人: | 江苏省城市规划设计研究院有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F40/211;G06F16/33;G06K9/62;G06Q50/14 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 210036 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 旅游景点 评论 情感 分析 方法 | ||
1.一种基于深度学习的旅游景点评论情感分析方法,其特征在于,包括:
步骤1、整理旅游景点评论数据,并对评论数据进行清洗;
步骤2、结合文本语言的分句、分词方法,对文本语句进行语义切割,建立用于分析的词汇库;
步骤3、判断语句的情感指向,进而提取分词列表的词汇,分析情感正负面,获取情感指向词汇;
步骤4、对情感指向词汇进行基本聚类,再通过共词矩阵对分类进行补充和完善,最后形成旅游目的地认知的反馈结果。
2.根据权利要求1所述的一种基于深度学习的旅游景点评论情感分析方法,其特征在于,步骤1中整理旅游景点评论数据,是将原始景点评论文本数据整理成结构化数据,包括景点名称、评论内容、评论时间、评论者昵称信息。
3.根据权利要求1所述的一种基于深度学习的旅游景点评论情感分析方法,其特征在于,步骤1对旅游景点评论数据进行清洗,具体如下:
(101)、通过程序语言对评论数据进行去重处理;
(102)、对原始数据进行观察判断,采用广告文本作为训练集,将景区评论信息作为验证集进行朴素贝叶斯分类,剔除掉广告类型文本。
4.根据权利要求3所述的一种基于深度学习的旅游景点评论情感分析方法,其特征在于,朴素贝叶斯分类的训练过程,是基于训练集来估计类鲜艳概率,并为每个属性估计条件概率;
朴素贝叶斯分类器具体公式如下:
其中
5.根据权利要求1所述的一种基于深度学习的旅游景点评论情感分析方法,其特征在于,步骤2所述对文本语句进行语义切割,是指对旅游景点评论进行分句分词处理,具体做法如下:
(201)、通过文本断点对所有景点评论进行断句,将每一句文本记录拆解为若干条记录,以尽可能保留文本记录里所有信息;
(202)、对语句进行分词,将分词结果保存进数据框架的分词列,最终将每一个分句解析成无标点、用空格间隔开的分词列表。
6.根据权利要求1所述的一种基于深度学习的旅游景点评论情感分析方法,其特征在于,步骤3中判断语句的情感指向,是采用SnowNLP算法对每一个分句进行语句情感指向分析,具体为:首先将景点存在的问题描述与正负面情感语言植入数据库,用其作为训练数据做出参考集并生成序列化的数据字典,用修正后的数据字典进行更精确的情感指向判断。
7.根据权利要求6所述的一种基于深度学习的旅游景点评论情感分析方法,其特征在于,步骤3中获取情感指向词汇,对情感为正面和负面的分词结果进行词频统计得到所有的正面和负面词汇,对单一词汇进行情感指向正负面分析,以此获取直接导致正负面的词汇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省城市规划设计研究院有限公司,未经江苏省城市规划设计研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110884900.7/1.html,转载请声明来源钻瓜专利网。