[发明专利]基于大数据文本挖掘的消费者政策感知分析方法及系统在审
| 申请号: | 202111434036.7 | 申请日: | 2021-11-29 |
| 公开(公告)号: | CN114265931A | 公开(公告)日: | 2022-04-01 |
| 发明(设计)人: | 刘勤;詹若贤;贾梦婷;谢春晖;温晓楠 | 申请(专利权)人: | 武汉理工大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/242;G06F40/289 |
| 代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 徐瑛 |
| 地址: | 430000 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 数据 文本 挖掘 消费者 政策 感知 分析 方法 系统 | ||
1.基于大数据文本挖掘的消费者政策感知分析方法,其特征在于,包括:
获取政策文本数据及消费者评论文本数据并进行预处理;
基于预处理后的文本数据构建政策语料库;
基于政策语料库进行消费者政策感知分析。
2.根据权利要求1所述基于大数据文本挖掘的消费者政策感知分析方法,其特征在于,获取政策文本数据及消费者评论文本数据的步骤进一步包括:
确定数据源;
利用网络爬虫工具采集政策文本数据和对应消费者评论文本数据;
对采集的数据源进行随机抽样,并与爬取到的数据进行匹配校验;
若爬取到的数据通过校验,则将对应数据作本地持久化存储。
3.根据权利要求1所述基于大数据文本挖掘的消费者政策感知分析方法,其特征在于,预处理进一步包括去重、去噪及文本短句删除。
4.根据权利要求1所述基于大数据文本挖掘的消费者政策感知分析方法,其特征在于,基于预处理后的文本数据构建政策语料库进一步包括:
对预处理后的政策文本和消费者评论文本数据进行词语拆分,并统计所有产生的词语的词频;
基于词频统计结果进行点间互信息筛选;
基于点间互信息筛选结果进行左右信息熵筛选;
基于左右信息熵筛选结果进行停用词及常见通用词汇的去除,得到政策专业词汇;
由专家知识语料库对得到的政策专业词汇进行筛选,并完善识别消费者评论中与政策感知相关的词汇,对筛选和完善后的词汇按照政策分类分为四类,形成最终的政策语料库。
5.根据权利要求1所述基于大数据文本挖掘的消费者政策感知分析方法,其特征在于,执行消费者政策感知挖掘分析进一步包括:
将消费者分为不同类别;
在不同类别消费者中挖掘评论数据,包括词频强度分析、话题识别、语义网络分析、情感倾向分析;
比较不同类别消费者的挖掘分析结果,得到不同消费者群体对于不同类别政策感知的差异。
6.根据权利要求5所述基于大数据文本挖掘的消费者政策感知分析方法,其特征在于,词频强度分析进一步包括:将构建的政策语料库以及相关领域细胞词库导入自定义词典,利用jieba进行消费者评论文本的分词,并统计词频强度;将词频结果按照政策分类划分,并根据词频强度生成对应词云图。
7.根据权利要求5所述基于大数据文本挖掘的消费者政策感知分析方法,其特征在于,话题识别进一步包括:
将分词后的消费者评论文本按照每篇文档一个列表的格式存储;
将文本转化成词袋模型对应的稀疏向量的表达,构建词频矩阵;
计算不同主题数模型的困惑度,确定最优的模型主题数;
将通过困惑度法评估得到的最优主题数作为参数,训练LDA模型,分析得到消费者评论中关注的主题。
8.根据权利要求5所述基于大数据文本挖掘的消费者政策感知分析方法,其特征在于,语义网络分析进一步包括:
根据政策语料库,在消费者评论文本中筛选出谈及到政策相关的评论文本;
统计评论文本中高频词两两之间共同出现的次数,得出这些词之间的紧密程度;
统计共现词对出现的频率,根据结果构建高频词共现矩阵;
根据高频词共现矩阵,利用NetDraw绘制语义网络图,得到语义网络图中各节点之间的层级、紧密关系,以此了解消费者对于政策的感知情况。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111434036.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种反循环双壁螺旋救援钻杆结构
- 下一篇:一种热电分离铜基板制造方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





