[发明专利]一种应用于股票新闻领域的态度倾向分析方法与系统在审
申请号: | 201710307190.5 | 申请日: | 2017-05-02 |
公开(公告)号: | CN107122351A | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 李青峰;朱留锋;荣强;田淑宁;胡楚晗 | 申请(专利权)人: | 灯塔财经信息有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/62 |
代理公司: | 深圳市六加知识产权代理有限公司44372 | 代理人: | 严泉玉 |
地址: | 430000 湖北省武汉市东西*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 股票 新闻 领域 态度 倾向 分析 方法 系统 | ||
1.一种应用于股票新闻领域的态度倾向分析方法,其特征在于,所述方法包括:
根据股票新闻标题的态度倾向属性建立由股票新闻标题构成的初始训练样本集,所述态度倾向属性包括正面、中性以及负面,所述初始训练样本集中包括正面、中性以及负面三个初始训练样本子集;
对所述初始训练样本集中的各股票新闻标题进行预处理得到处理后训练样本集,所述预处理包括分词、数字化以及向量补齐,所述处理后训练样本集包括具有相同维度的用于表示各股票新闻标题的数字向量;
建立一个由输入层、中间层以及输出层构成的多层LSTM神经网络,利用处理后训练样本集对所述神经网络进行训练,得到训练后神经网络模型;
利用所述训练后神经网络模型对待检测股票新闻标题进行态度倾向属性的判别,得到所述待检测股票新闻标题的态度倾向属性。
2.如权利要求1所述的应用于股票新闻领域的态度倾向分析方法,其特征在于,
所述多层LSTM神经网络的输入层为特征表示层,用于将输入的用于表示各股票新闻标题的数字向量进一步表示为预设维度的特征向量;
所述多层LSTM神经网络的中间层为双向LSTM层,由预设数量个LSTM单元组成,用于学习所述特征向量的语义特征,所述预设数量为所述预设维度的一半;
所述多层LSTM神经网络的输出层为一个全连接层,使用sigmoid激活函数,用于输出一个浮点数值作为整个神经网络的输出。
3.如权利要求1或2所述的应用于股票新闻领域的态度倾向分析方法,其特征在于,所述预处理中的分词、数字化以及向量补齐,具体为:
将股票新闻标题进行分词,得到M个词语,所述M为该股票新闻标题中词语的数量;
将所述股票新闻标题的每个词语编码成一个整数,生成一个由整数编码组成的M维向量;
将所述M维向量通过右侧补零的方式生成具有相同长度的N维向量;所述N为预设值,且M<N。
4.如权利要求1或2所述的应用于股票新闻领域的态度倾向分析方法,其特征在于,所述方法还包括错误样本的处理和神经网络模型的优化,具体为:
如果利用所述训练后神经网络模型对待检测股票新闻标题进行态度倾向属性的判别结果有误,则将判别有误的待检测股票新闻标题标记正确的态度倾向属性,并加入所述初始训练样本集中,重新训练所述LSTM神经网络。
5.如权利要求1或2所述的应用于股票新闻领域的态度倾向分析方法,其特征在于,所述初始训练样本集中股票新闻标题的态度倾向属性通过人工进行标记。
6.如权利要求1或2所述的应用于股票新闻领域的态度倾向分析方法,其特征在于,所述输入层生成的特征向量的维度为128,所述中间层中LSTM单元的数量为64。
7.如权利要求1或2所述的应用于股票新闻领域的态度倾向分析方法,其特征在于,所述正面、中性以及负面三个初始训练样本子集中包含的股票新闻标题的数量的差值小于预设值。
8.一种应用于股票新闻领域的态度倾向分析系统,其特征在于,包括初始训练样本集生成模块、训练样本集预处理模块、神经网络模块训练模块以及态度倾向属性判别模块,其中:
所述初始训练样本集生成模块,用于根据股票新闻标题的态度倾向属性建立由股票新闻标题构成的初始训练样本集,所述态度倾向属性包括正面、中性以及负面,所述初始训练样本集中包括正面、中性以及负面三个初始训练样本子集;
所述训练样本集预处理模块,用于对所述初始训练样本集中的各股票新闻标题进行预处理得到处理后训练样本集,所述预处理包括分词、数字化以及向量补齐,所述处理后训练样本集包括具有相同维度的用于表示各股票新闻标题的数字向量;
所述神经网络模块训练模块,用于建立一个由输入层、中间层以及输出层构成的多层LSTM神经网络,利用处理后训练样本集对所述神经网络进行训练,得到训练后神经网络模型;
所述态度倾向属性判别模块,用于利用所述训练后神经网络模型对待检测股票新闻标题进行态度倾向属性的判别,得到所述待检测股票新闻标题的态度倾向属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于灯塔财经信息有限公司,未经灯塔财经信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710307190.5/1.html,转载请声明来源钻瓜专利网。