[发明专利]基于个人计算机电商评论的多粒度观点挖掘方法在审
申请号: | 201910571890.4 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110555109A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 姚全珠;陈晨;费蓉;吕鹏;赵佳瑜 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/951;G06F17/27;G06Q30/02 |
代理公司: | 61214 西安弘理专利事务所 | 代理人: | 王蕊转 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明公开了一种基于个人计算机电商评论的多粒度观点挖掘方法,首先从网页中获取电商评论,并对评论进行自动化地标注;然后对电商评论进行预处理;对预处理后的语料中单句进行“方面‑观点”对的识别,并区分观点词和方面词;对方面的上下文短语进行短语级别的情感分类;最后对评论整体进行文本级别的情感分类,得到商品整体及各个方面的观点挖掘结果。本发明解决了现有技术中存在的无法自动化地挖掘评论中包含的各个属性方面的反馈信息的问题。 | ||
搜索关键词: | 评论 预处理 情感分类 自动化 个人计算机 上下文短语 短语 反馈信息 商品整体 挖掘结果 挖掘 语料 标注 网页 | ||
【主权项】:
1.基于个人计算机电商评论的多粒度观点挖掘方法,其特征在于,具体按照以下步骤实施:/n步骤1、从网页中获取电商评论,评论中包含评论文本和评论的5分制数字评分,将产品评论按数字评分进行星级划分:将数字评分大于3分的评论定为积极评论,将数字评分小于等于3分的评论定为消极评论,以此作为特征向量类别标注的依据;/n步骤2、对步骤1的电商评论进行分词、去除停用词和词性标注操作,得到预处理后的语料;/n步骤3、对步骤2得到的预处理后的语料中的每一条评论的每一个单句进行“方面-观点”对的识别,并区分观点词和方面词;/n步骤4、提取步骤3识别出的每一个方面的上下文短语,并对方面的上下文短语进行短语级别的情感分析,得到每一个方面的情感倾向度;/n步骤5、对于步骤2得到的预处理后语料中的每一条评论,以步骤3中提取出的方面为特征构建特征向量,并训练和测试支持向量机分类器,最后得到商品整体的情感倾向度。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910571890.4/,转载请声明来源钻瓜专利网。