[发明专利]一种融合点评配图的情感分析方法有效
申请号: | 201710940129.4 | 申请日: | 2017-10-11 |
公开(公告)号: | CN107818084B | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 张献涛;张猛;林小俊;焦宇 | 申请(专利权)人: | 北京众荟信息技术股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100088 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 点评 情感 分析 方法 | ||
本发明公开了一种融合点评配图的情感分析方法,本方法为:获取目标酒店的评论数据;对每一所述评论数据中的文本进行分词;根据分词对该评论数据的文本进行向量化,得到该评论数据的文本向量化表示;对每一所述评论数据中的图片集合进行向量化,得到该评论数据的图片集合向量化表示;对每一所述评论数据,根据该评论数据的文本向量化表示和图片集合向量化表示,对该评论数据进行情感分析,得到该评论数据的情感类别。本发明能够自动地从点评数据中分析出点评的情感极性,提高了识别效率和准确性。
技术领域
本发明属于信息技术、数据挖掘技术领域,具体涉及一种融合点评配图的情感分析的方法。
背景技术
当前,越来越多的用户都会在互联网上分享自己的观点或体验。大量的用户生成数据也因此产生。所谓的用户生成数据(User Generated Content,UGC)是指用户通过各种终端上传的原创内容,这些内容来源于用户又服务用户。UGC中很大的部分就是互联网上的点评数据。当前的点评不仅有传统的文本形式,各种图片甚至视频的信息也都出现在点评中。这些丰富的信息可以充分地表达用户的点评观点和情感。当有其他用户看到点评时,也会被影响选择。现在人们都已经意识到社交网络上评论的强大:点评可以产生社交网络热点,优质的丰富的评论能直接提升销售和美誉度;差评甚至具有诋毁性质的点评则有可能造成难以挽回的损失。
如何对点评进行分析是一个重要的需求。每一家面向个人消费者的公司和商家都会关心用户的点评,希望借助技术手段获取用户的点评反馈,用于指导自身的品牌管理和运营管理,提升品牌形象和服务质量。如果仅靠人工的方法是难以应对在线海量点评的收集和处理。因此,迫切需要计算机帮助用户快速获取和整理这些点评信息。
情感分析(Sentiment Analysis)技术应运而生,情感分析不仅是信息处理领域的研究热点,在产业界也引起了广泛关注。它通过分析相关UGC的语言文字得到人们所要表达的情感或者挖掘用户的意见。但是目前的研究方法普遍基于文本信息,在当前的点评数据中,已不局限于文字,还有各类的图片(点评配图)。对于文字,不同地域不用背景的人在不同语境下都会产生不同的理解;但是对于图片,人们的反应是具有一定的一致性。如果能结合点评的文本和配图信息,对点评进行情感的分析,将会对情感分析的准确性有较大的提升。
发明内容
针对现有技术中存在的技术问题,本发明的目的在于提供一种融合点评配图的情感分析方法。本发明是基于语料库的统计方法或机器学习方法,自动地从点评数据中分析出点评的情感极性。
本发明采用的技术方案如下:
一种融合点评配图的情感分析方法,其步骤包括:
1)获取目标酒店的评论数据;
2)对每一所述评论数据中的文本进行分词;根据分词对该评论数据的文本进行向量化,得到该评论数据的文本向量化表示;对每一所述评论数据中的图片集合进行向量化,得到该评论数据的图片集合向量化表示;
3)对每一所述评论数据,根据该评论数据的文本向量化表示和图片集合向量化表示,对该评论数据进行情感分析,得到该评论数据的情感类别。
进一步的,所述步骤2)中,得到该评论数据的文本向量化表示的方法为:
21)将该评论数据中的文本划分为n个句子,表示为{Sentence1,Sentence2,…,Sentencen};将第i个句子Sentencei包含的分词表示为其中max表示允许的句子的最大的长度;
22)将每一个句子中的每一个分词映射为一个低维连续向量;
23)对于每一句子,根据语义分析算式和该句子的各分词的低维连续向量,获得该句子的语义向量;
24)根据该评论数据的各句子的语义向量得到该评论数据的文本向量化表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京众荟信息技术股份有限公司,未经北京众荟信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710940129.4/2.html,转载请声明来源钻瓜专利网。