[发明专利]一种改进的电商产品痛点分析方法有效
申请号: | 201810189232.4 | 申请日: | 2018-03-08 |
公开(公告)号: | CN108388660B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 徐新胜;余建浙 | 申请(专利权)人: | 中国计量大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/31;G06F40/242;G06F40/289;G06Q30/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种改进的电商产品痛点分析方法,其中所述方法包括:获取商品评论数据,采集的评论数据需要包括产品名称、用户评论文本、用户评论时间,作为评论数据集;对采集的评论数据集进行预处理操作,包括评论文本进行分词、新词发现以及词性标注等处理;产品痛点特征的提取与聚类,利用汉语组块标记,使用SVM进行产品特征提取,根据Apriori算法产生频繁项集以及TF‑IDF阈值过滤,得到产品痛点特征集合,然后基于改进的Kmeans++对痛点特征进行聚类;整合网上的情感词库,利用情感词库对产品的痛点特征进行情感倾向量化,最终得到电商产品痛点特征得分。电商产品痛点分析为用户购买决策、企业竞争策略制定提供重要情报支撑。 | ||
搜索关键词: | 一种 改进 产品 分析 方法 | ||
【主权项】:
1.一种改进的电商产品痛点分析方法,其特征是包括如下步骤:步骤S1:获取商品评论数据,首先利用网络爬虫工具编写好爬虫规则,设定评论数据的时间区间,并用网络爬虫采集用户评论数据包括以下要素:产品名称、用户评论文本、用户评论时间,然后对各信息要素进行提取,通过编程持久化到数据库中;步骤S2:利用所述步骤S1中得到的数据进行预处理,利用JAVA语言编写程序对数值型数据进行去重复、数据转化和数据归约等操作,同时文本信息数据利用中科院NLPIR分词工具进行分词、词性标注和停用停用词等处理;步骤S3:产品痛点特征的提取与聚类,利用所述步骤S2预处理后的数据,确定汉语组块标记,然后选取一定量的分词数据进行汉语组块标记,接着使用SVM进行产品特征提取,最后根据Apriori算法产生频繁项集以及TF‑IDF阈值过滤,得到产品痛点特征集合,然后基于改进的Kmeans++对痛点特征进行聚类,减少产品特征维度,对产品的痛点特征进行集中分析;步骤S4:网上现有的情感词典在处理特定领域的评论文本时不能很好地囊括特定领域情感词,因此在产品评论情感分析前,需要根据研究对象构建相应领域的情感词典,对通用情感词典进行适当补充,并对情感词典进行量化,这样评估的情感倾向相对比较准确;步骤S5:通过观察大量的评论文本,得出产品痛点特征的出现往往伴随着消费者情感倾向即评价词,因此,以痛点特征为情感分析对象,以逗号为最小情感语义单元分隔符,结合S3步骤得到的痛点特征和S4的量化情感词典,对与痛点特征处于同一个语义单元的情感词进行情感值计算,并将该情感值赋予对应痛点特征,最后得到每个产品的痛点特征得分。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810189232.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种文件浏览方法和装置
- 下一篇:广告创意图片的生成方法及系统