[发明专利]基于机器学习的商家评论分析系统及方法在审
申请号: | 202111188450.4 | 申请日: | 2021-10-12 |
公开(公告)号: | CN113987168A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 刘玮;束鑫;叶华 | 申请(专利权)人: | 江苏科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/284;G06K9/62;G06N20/00;G06Q30/02 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 徐澍 |
地址: | 212003 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 商家 评论 分析 系统 方法 | ||
本发明公开了一种基于机器学习的商家评论分析系统,包括:数据处理层、机器学习算法层、用户服务层;所述数据处理层,用于获取平台数据,对平台数据进行预处理、文本分词及词云生成,输出评价数据集;所述机器学习算法层,使用评论数据集进行模型训练、情感分析、聚类分析,输出评价数据的情感积极度、商家分类标签;所述用户服务层,向用户提供商家推荐、搜索、分类、商家数据分析、评论数据分析信息。本发明采用机器学习算法分析用户评论数据,量化用户情感数据,挖掘评论中用户的情绪与态度,能够精细化商家评价,弥补了平台评分的短板,构建多维度评分模型,实现了更加精准的商家评价体系。
技术领域
本发明涉及机器学习、自然语言处理技术领域,具体而言,涉及一种基于机器学习的商家评论分析系统及方法。
背景技术
随着网络消费规模的扩大,外卖、生活服务预订平台也随之兴起,互联网消费平台成为了重要的信息交互与数据的载体。参考在线评论信息是人们进行购买决策的一个重要环节。平台中海量的用户评论信息蕴含着人们对商品价格、质量等方面的体验感受,通过对评论数据的情感分析能够为用户带来更有参考价值的商家信息,同时能够让商家及时了解问题并进行改进。
机器学习是人工智能的一种实现方式,使系统能够从数据中学习,通过训练集不断识别情感特征,进行建模,最终形成有效的数据处理方式。本发明将机器学习技术应用于评论数据的分析中,系统将评论的有效信息进行提取,对情感词、特点词匹配,并使用评价算法得出依据评论的商家评分。
情感分析是一种自然语言处理方法的应用,对带有感情色彩的主观性文本进行分析、处理、归纳和整理,同时利用情感得分指标来量化数据。但情感分析并不足以概括商家的真实情况,具有一定的局限性,因此,本发明结合商家特征词进行了多维评价的拓展。
公开号为CN107992550A的中国专利文献公开了一种网络评论分析方法及系统,其进行情感分析采用预设多个置信度区间,进行情感词汇的区间匹配,这样的方法类似人工分类,分类出的情感倾向误差较大。
发明内容
本发明的目的是提供一种基于机器学习的商家评论分析系统及方法,以解决现有算法耗时长、准确率低的问题。
本发明提供了一种基于机器学习的商家评论分析系统,包括:数据处理层、机器学习算法层、用户服务层;
所述数据处理层,用于获取平台数据,对平台数据进行预处理、文本分词及词云生成,输出评价数据集;
所述机器学习算法层,使用评论数据集进行模型训练、情感分析、聚类分析,输出评价数据的情感积极度、商家分类标签;
所述用户服务层,向用户提供商家推荐、搜索、分类、商家数据分析、评论数据分析信息。
进一步地,所述数据处理层包括:数据获取模块、数据处理模块;
所述数据获取模块,用于对不同平台的用户评论进行数据爬取,并将原始数据进行分类整理、存储;
所述数据处理模块,用于评价数据预处理、文本分词、文本向量化,以及词云的生成。
进一步地,所述机器学习算法层包括:模型训练模块、情感分析模块、聚类分析及标签生成模块;
所述模型训练模块,使用所述数据处理层输出的评价数据,并采用人工标记的方式对朴素贝叶斯模型进行训练;
所述情感分析模块,使用朴素贝叶斯模型计算情感积极度;
所述聚类分析及标签生成模块,采用改进k-means算法对情感分析后的评论数据进行聚类分析,并绑定标签。
本发明还提供了一种基于机器学习的商家评论分析系统的分析方法,适用于上述基于机器学习的商家评论分析系统,包括如下步骤:
步骤1:采用爬虫技术抓取平台的用户评论数据、商家数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏科技大学,未经江苏科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111188450.4/2.html,转载请声明来源钻瓜专利网。