[发明专利]一种汽车舆情情感分析方法在审
申请号: | 202210099074.X | 申请日: | 2022-01-27 |
公开(公告)号: | CN114547167A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 杜阿卫;刘珍茹 | 申请(专利权)人: | 启明信息技术股份有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/33;G06F40/30;G06N3/08 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 詹权松 |
地址: | 130117 吉林省长春市长*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 汽车 舆情 情感 分析 方法 | ||
1.一种汽车舆情情感分析方法,其特征在于,具体包括以下步骤:
S1:采集并整理指定汽车品牌的基础数据;
S2:对采集得到的基础数据进行处理,清除其中的垃圾信息,得到最终有用数据;
S3:对有用数据进行剖析分类,根据判断规则标注正中负向语料;
S4:生成语料库;
S5:进行环境搭建与参数配置,进行数据处理和句向量转换;
S6:搭建神经网络和预处理模型;
S7:进行模型训练和优化,得出最优模型;
S8:通过最优模型对文章进行情感分析,若是负向情感,则判断出负向预警程度。
2.如权利要求1所述的一种汽车舆情情感分析方法,其特征在于,所述S1具体包括以下子步骤:
S11:通过多渠道进行基础数据采集,所述多渠道包括:新闻文章、论坛贴吧及网络视频;
S12:对S11中采集的基础数据进行ETL程序清洗转换,将清洗转换之后的数据存储在多维分析数据库中;
S13:根据汽车性质制作汽车等级信息表,根据汽车特征信息和汽车企业信息制作汽车特征记录表和汽车企业登记表。
3.如权利要求1所述的一种汽车舆情情感分析方法,其特征在于,所述S2具体包括以下子步骤:
S21:网络渠道清洗:判断网络渠道是否与汽车等级信息表想对应,若是,则保留,若否,则对其进行垃圾信息清除;
S22:数据标题清洗:根据数据标题与汽车等级信息表、汽车特征记录表和汽车企业登记表的相关度进行垃圾信息清除;
S23:进行文章查漏:对文章内容进行查找,判断文章内容与汽车等级信息表的相关度,设置相关度阈值,若大于该阈值,则保留文章内容,若否,则对其进行垃圾信息清除。
4.如权利要求1所述的一种汽车舆情情感分析方法,其特征在于,所述S3中根据判断规则标注正中负向语料具体包括:文章类型判断规则、论坛类型判断规则及音视频类型判断规则。
5.如权利要求1所述的一种汽车舆情情感分析方法,其特征在于,所述S4中语料库为结构性数据存储系统,其包括:文章ID、内容、地址、正负向类别,同时可关联得到获取时间、发布时间、媒体渠道及文章热度。
6.如权利要求1所述的一种汽车舆情情感分析方法,其特征在于,所述S5具体包括以下子步骤:
S51:配置通用参数的路径;
S52:读取数据,对数据进行预处理,去掉标点与停用词;
S53:用bert做句向量转换,将每条数据向量压缩成一维;
S54:句向量压缩好后,将数据进行按比例分组,分成:训练数据、测试数据及预测数据。
7.如权利要求1所述的一种汽车舆情情感分析方法,其特征在于,所述S6中搭建神经网络为Bilstm网络,其具体包括以下子步骤:
S61:利用tensorflow搭建神经网络基础架构;
S62:采用Adam进行优化算法的设计;
S63:利用sparse_categorical_crossentropy进行损失函数设计;
S64:构建评价指标,选用综合准确率和召回率的F1-score作为评价标准。
8.如权利要求1所述的一种汽车舆情情感分析方法,其特征在于,所述S6中搭建预处理模型包括以下子步骤:
S65:进行超参数设置,将学习率和batch-size加载到配置文件中;
S66:将搭建好的神经网络加载进预处理模型中,配置初始化权重。
9.如权利要求1所述的一种汽车舆情情感分析方法,其特征在于,所述S7中模型训练的训练环境为gpu。
10.如权利要求1所述的一种汽车舆情情感分析方法,其特征在于,所述S7中对模型进行数据质量、数量、模型框架及算法上的优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于启明信息技术股份有限公司,未经启明信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210099074.X/1.html,转载请声明来源钻瓜专利网。