[发明专利]一种基于舆论数据的股票异动分析方法在审
申请号: | 201810188058.1 | 申请日: | 2018-03-07 |
公开(公告)号: | CN108335210A | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 罗智凌;靳婷;李莹;尹建伟;邓水光;吴朝晖 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06Q40/06 | 分类号: | G06Q40/06;G06F17/27 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 王琛 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于舆论数据的股票异动分析方法,其建立了一套文本情感分析的模型,通过自然语言处理技术,提取海量的舆论数据的特征,挖掘出与特定的股票异常波动类型的特征,帮助领域专家和数据分析师分析股票的行情,帮助投资者获取关键信息,改善投资策略,并给定通用的方法,大大提高金融文本数据分析的效率,符合领域专家及投资者的需要。此外,本发明对于不同的股票异动结果类型均适用,能够指导领域专家对舆论的情感特征进行提取,给出情感分析所需要的数据及信息,使得领域专家在股票异动检测的工作中尽量发挥其领域知识方面的优势,更加全面准确地掌握有效信息,有助于改善投资策略。 | ||
搜索关键词: | 股票 异动分析 自然语言处理技术 文本数据分析 波动类型 关键信息 结果类型 领域知识 情感分析 情感特征 文本情感 异动检测 有效信息 通用的 异动 分析 帮助 投资 挖掘 金融 | ||
【主权项】:
1.一种基于舆论数据的股票异动分析方法,包括如下步骤:(1)对舆论数据进行采集并通过预处理得到多个样本集,所述样本集为固定时间段内关于股票的所有文章及其评论集合,其中的样本即为关于任一股票的一篇文章及其评论;(2)根据股票龙虎榜中的股票异动类型对样本进行类别标注,并将具有类别标注信息的样本分为训练集、验证集和测试集;(3)获取金融领域词典、情感词典以及程度副词词典,根据上述词典或通过word2vec方法对样本进行分词,即将样本中的每个词转换成词向量形式,从而得到每个句子由词向量所组成的词向量矩阵;(4)将一个样本中长度不同的句子所对应的词向量矩阵统一转换成固定维度大小的特征向量,进而将所有句子对应的特征向量合并后作为样本的特征向量;(5)将同一天内关于同一股票的所有样本的特征向量级联拼接成一个特征向量X,进而将所有特征向量X输入至CNN中,CNN的输出为对应一个日期戳的特征向量Y;(6)对于任一发生异动的股票,将该股票异动发生前一定时间段内的所有特征向量Y级联拼接成一个特征向量Z,进而将所有特征向量Z输入至LSTM中,LSTM的输出为对应一种异动类型的特征向量W;(7)将特征向量W、关于单股发帖量的特征信息以及大盘发帖量的变化特征信息共同输入至SVM中进行训练,得到用于股票异动分析的模型,进而利用该模型对股票异动提前做出分析预判。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810188058.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种包括供应端索引区块链的分布式能源系统
- 下一篇:保单时限管理方法和系统