[发明专利]一种融合点评配图的情感分析方法有效
申请号: | 201710940129.4 | 申请日: | 2017-10-11 |
公开(公告)号: | CN107818084B | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 张献涛;张猛;林小俊;焦宇 | 申请(专利权)人: | 北京众荟信息技术股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100088 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 点评 情感 分析 方法 | ||
1.一种融合点评配图的情感分析方法,其步骤包括:
1)获取目标酒店的评论数据;
2)对每一所述评论数据中的文本进行分词;根据分词对该评论数据的文本进行向量化,得到该评论数据的文本向量化表示;对每一所述评论数据中的图片集合进行向量化,得到该评论数据的图片集合向量化表示;其中,
得到该评论数据的文本向量化表示的方法为:21)将该评论数据中的文本划分为n个句子,表示为{Sentence1,Sentence2,…,Sentencen};将第i个句子Sentencei包含的分词表示为其中max表示允许的句子的最大的长度;22)将每一个句子中的每一个分词映射为一个低维连续向量;23)对于每一句子,根据语义分析算式和该句子的各分词的低维连续向量,获得该句子的语义向量;24)根据该评论数据的各句子的语义向量得到该评论数据的文本向量化表示;
得到该评论数据的图片集合向量化表示的方法为:将该评论数据中包含的n个配图表示为{Picture1,Picture2,…,Picturen};对该评论数据中的每一配图统一归一化为设定大小的RGB图像,作为深度卷积网络CNN的输入,其中第i个配图Picturei通过深度卷积网络CNN进行变换,得到对应的单张配图的语义向量表示为Pi;将各配图的语义向量输入LSTM层进行编码,经过一个平均池化层,得到该评论数据的图片集合向量化表示dpicture;
3)对每一所述评论数据,将该评论数据的文本向量化表示dtext和图片集合向量化表示dpicture合并得到该评论数据的增强向量d=dpicture∪dtext;将该评论数据的增强向量d作为情感分类特征,使用一个非线性层将该增强向量d映射到预测目标空间K的C个情感分类上,得到其中,表示该增强向量d在C维空间的分布;Wc是在C维空间上的权重矩阵,bc为偏置系数向量;然后根据计算该评论数据的情感类别;其中,是增强向量中第i个元素,是增强向量中第k个元素;pi为该评论数据在情感分类i上的预测概率,C为情感分类类别的数量。
2.如权利要求1所述的方法,其特征在于,所述步骤22)中,采用文本深度表示模型对句子进行编码获得该句子中各分词的词向量;所述步骤23)中,将每一句子的各词向量当作一个长短期记忆神经网络LSTM的输入,得到该句子的语义向量。
3.如权利要求1所述的方法,其特征在于,所述深度卷积网络CNN包括5个卷积层和3个全连接层;其中输入数据依次经5个卷积层后再经过3个全连接层输出。
4.如权利要求3所述的方法,其特征在于,所述深度卷积网络CNN的前两层卷积层和第5个卷积层后分别设有一池化层;所述卷积层、所述池化层以及所述全连接层的前两层的参数与AlexNet模型的配置一致。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京众荟信息技术股份有限公司,未经北京众荟信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710940129.4/1.html,转载请声明来源钻瓜专利网。