[发明专利]一种酒店特色点评抽取的方法有效

专利信息
申请号: 201710301052.6 申请日: 2017-05-02
公开(公告)号: CN107122471B 公开(公告)日: 2020-07-10
发明(设计)人: 张猛;张献涛;林小俊 申请(专利权)人: 北京众荟信息技术股份有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/951;G06F16/9532;G06F40/284;G06Q50/12
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 司立彬
地址: 100088 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 酒店 特色 点评 抽取 方法
【说明书】:

发明公开了一种酒店特色点评抽取的方法。本方法为:1)获取目标酒店的评论数据;并对所述评论数据进行分词处理;2)对分词处理后的评论数据进行情感倾向性检测,选取若干有情感的评论数据;3)对于每一所选评论数据,提取该评论数据中的特征词并记录每一特征词在该评论数据中出现的频率;4)根据评论数据的长度、评论数据的特征词及其频率,计算该评论数据的特色分值;5)根据评论数据的特色分值选取若干评论数据作为该目标酒店的特色点评。本发明基于语料库的统计方法或机器学习方法,自动地从点评数据中抽取相应的点评片段,得到高质量的新颖的点评。

技术领域

本发明属于信息技术、数据挖掘技术领域,具体涉及一种基于酒店数据的特色点评抽取的方法。

背景技术

随着电子商务的迅猛发展,越来越多的用户乐于在互联网上分享自己的观点或体验,互联网上的点评不仅影响用户的选择而且无形中也对品牌产生深刻的影响。现在每一家面向个人消费者的公司和商家,都意识到社交网络上评论的强大。点评可以制造社交网络热点,好的评论能直接提升销售和美誉度;差评则有可能造成难以挽回的损失。

以酒店业为例,酒店希望借助技术手段获取用户的点评反馈,用于指导酒店的品牌管理和运营管理,提升品牌形象和服务质量。用户希望查看其他用户的点评,特别是高质量的有特色的点评,可以明确酒店的优点和缺点,令用户能印象深刻,以此作为预订的重要参考。

如何发现点评中的高质量点评,特别是能从点评中找到有特色的新颖的点评,是一个重要的需求。如果在整段的点评中,找到类似“隔一条马路就是免费海滩”、“最大的特色是酒店有个小花园”之类的有比较丰富的细节信息的特色点评。目前纯人工整理和标注特色点评,规模是不够的,效率也非常低。

发明内容

针对现有技术中存在的技术问题,本发明的目的在于提供一种酒店特色点评抽取的方法。本发明是基于语料库的统计方法或机器学习方法,自动地从点评数据中抽取相应的点评片段,得到高质量的新颖的点评。

本发明采用的技术方案如下:

一种酒店特色点评的抽取方法,包括如下步骤:

1、确定目标酒店,并获取目标酒店的评论数据;

2、对所述评论数据进行分词等预处理;

3、对预处理后的评论数据进行情感倾向性检测;

4、选取有情感的评论,在评论中提取特征词(包括停用词、特色词、维度词)并记录每个特征词在该评论中对应的频率;

5、选取的每个评论用(停用词个数,特色词个数,维度词个数,评论长度)四元组进行表示,计算特色分值。

6、选择最高得分四元组对应的评论,作为特色点评输出。

进一步地,步骤1)通过聚焦爬虫从点评网站获取在线点评数据。

进一步地,步骤2)首先根据“。”、“!”、“?”3个标点符号进行断句。然后采用基于词典的最大匹配分词方法进行分词,针对分词有歧义的部分采用序列标注的分词方法得到正确的分词结果;所述序列标注的分词方法将词的切分问题转换为字的分类问题,每个字根据其在词中的不同位置,赋予不同的位置类别标记,基于这样的标记序列确定句子的切分方式。

进一步地,步骤3)将出现维度词情感词的评论数据作为候选评论数据,采用LSTM(Long-short Term Memory)模型对候选评论数据的极性进行判别,得到候选评论数据的情感倾向性,所述情感类别包括-1、0、1三类,分别表示差评、无情感、好评,将差评和好评的评论数据作为有情感的评论数据。

进一步地,步骤4),使用了特征词库(包括停用词库、特色词库和维度词库),进行对比查找,确定出评论中的特征词并计算每一特征词对应的频次。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京众荟信息技术股份有限公司,未经北京众荟信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710301052.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top