[发明专利]一种基于互联网用户评论的数据分析方法及系统有效
申请号: | 201810167403.3 | 申请日: | 2018-02-28 |
公开(公告)号: | CN108364199B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 周通;张绪玲;于潇潇 | 申请(专利权)人: | 北京搜狐新媒体信息技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/35;G06F40/289 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 古利兰;王宝筠 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 互联网 用户 评论 数据 分析 方法 系统 | ||
本申请公开了一种基于互联网用户评论的数据分析方法,获取用户在互联网上的评论信息,将评论信息进行切词得到该评论信息的评论词语信息,将预设的分类关键词与评论词语信息进行对比,并将符合分类关键词的评论词语信息划入该分类关键词的类别中,将预设的情感标注词与分类后的评论词语信息进行对比,生成分类后的评论词语信息的情感信息,情感信息包括正向情感信息和/或负向情感信息,基于情感信息及评论词语信息生成类别的口碑信息。本发明由于是自动爬取各网站相应的语料,人力成本相对较低、回收难度简单;用户的一切行为都是其自身偏好的真实反映,可以保证真实性;最后由于是对整体用户的大数据分析,而非样本推测整体,分析的准确率高。
技术领域
本申请涉及数据分析技术领域,尤其涉及一种基于互联网用户评论的数据分析方法及系统。
背景技术
随着近年来互联网、移动互联网的发展,营销从以产品为中心逐渐转换到以用户为中心,通过获取品牌的用户评论,一方面可以确定品牌在用户心中的地位,优势、劣势,进行有针对性的营销互动;另一方面可以寻找潜在客户的新期望点,使用社交数据洞察消费者的需求。
现有的营销口碑分析大多采用传统调研方式得到,传统调研方法通常采用问卷调查,而问卷调查会受问卷设计、样本容量、调查方法,问卷回收、时间人力经费等限制,比如调查问卷设计难,如何科学合理的设计问卷;调查结果广而不深;问卷调查经常采用由用户自己填答问卷的方式,调查结果的质量得不到很好的保证;收集到的数据多数为小部分数据,用样本数据来推测整体,结果准确率不高。所以企业用此方法会存在问卷设计难、调查结果真实性无法保证、由样本推测整体准确率不高等缺点。
因此,如何保证营销口碑分析的真实性,提高分析结果的准确率成为了本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本申请提供了一种基于互联网用户评论的数据分析方法,与现有技术相比本发明以用户的互联网评论进行分析的口碑分析方法,由于是自动爬取各网站相应的语料,人力成本相对较低、回收难度简单;用户的一切行为都是其自身偏好的真实反映,可以保证真实性;最后由于是对整体用户的大数据分析,而非样本推测整体,分析的准确率高。
本申请提供了一种基于互联网用户评论的数据分析方法,包括:
获取用户在互联网上的评论信息;
将所述评论信息进行切词得到该评论信息的评论词语信息;
将预设的分类关键词与所述评论词语信息进行对比,并将符合所述分类关键词的评论词语信息划入该分类关键词的类别中;
将预设的情感标注词与分类后的评论词语信息进行对比,生成分类后的评论词语信息的情感信息,所述情感信息包括正向情感信息和/或负向情感信息;
基于所述情感信息及所述评论词语信息生成所述类别的口碑信息。
优选地,在所述将所述评论信息进行切词得到该评论信息的评论词语信息之前还包括:
对所述评论信息进行清洗,去除所述评论信息中的杂质。
优选地,所述杂质包括所述评论信息中文字显示为空白的评论信息、所述评论信息中语料长度超过预设阈值的评论信息及所述评论信息中非用户生成内容评论信息中的任意一项或多项。
优选地,所述分类关键词包括行业关键词、品类关键词及品牌关键词中的任意一项或多项,所述类别包括行业类别、品类类别及品牌类别中的任意一项或多项,所述口碑信息包括类别热度信息、类别形象信息、类别正面指数,所述基于所述情感信息及所述评论词语信息生成所述类别的口碑信息包括:
基于评论词语信息的数量生成与之对应的类别的热度信息;
基于情感信息的情感方向及数量生成所述类别的类别正面指数和/或类别形象信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狐新媒体信息技术有限公司,未经北京搜狐新媒体信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810167403.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置