[发明专利]一种基于舆论数据的股票异动分析方法在审

专利信息
申请号: 201810188058.1 申请日: 2018-03-07
公开(公告)号: CN108335210A 公开(公告)日: 2018-07-27
发明(设计)人: 罗智凌;靳婷;李莹;尹建伟;邓水光;吴朝晖 申请(专利权)人: 浙江大学
主分类号: G06Q40/06 分类号: G06Q40/06;G06F17/27
代理公司: 杭州天勤知识产权代理有限公司 33224 代理人: 王琛
地址: 310013 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 股票 异动分析 自然语言处理技术 文本数据分析 波动类型 关键信息 结果类型 领域知识 情感分析 情感特征 文本情感 异动检测 有效信息 通用的 异动 分析 帮助 投资 挖掘 金融
【说明书】:

发明公开了一种基于舆论数据的股票异动分析方法,其建立了一套文本情感分析的模型,通过自然语言处理技术,提取海量的舆论数据的特征,挖掘出与特定的股票异常波动类型的特征,帮助领域专家和数据分析师分析股票的行情,帮助投资者获取关键信息,改善投资策略,并给定通用的方法,大大提高金融文本数据分析的效率,符合领域专家及投资者的需要。此外,本发明对于不同的股票异动结果类型均适用,能够指导领域专家对舆论的情感特征进行提取,给出情感分析所需要的数据及信息,使得领域专家在股票异动检测的工作中尽量发挥其领域知识方面的优势,更加全面准确地掌握有效信息,有助于改善投资策略。

技术领域

本发明属于自然语言处理及数据挖掘技术领域,具体涉及一种基于舆论数据的股票异动分析方法。

背景技术

随着互联网技术的飞速发展,信息化与金融行业的深度融合,专家和权威机构在互联网上发布的海量有价值的评论、重要金融事件的报道和公司披露等,已成为领域专家和投资者了解金融市场的重要的信息来源。然而,与股票行情走势和投资相关性较强的关键信息被隐藏在庞大的文本中,另人眼花缭乱,不能及时地获取有效信息。

行为经济学表明情绪会深刻地影响个人的行为和决策,这是否也适用于股票行业,即股民的情绪状态可能对其交易行为产生影响;股民的情感信息是否与股票的行情走势相关,甚至能否基于异常波动趋势之前的相关文本内容预测股票的异常波动?因此,基于趋势之前的舆论数据对股票异常波动进行分析具有相当重要的价值意义。

现阶段的金融数据分析,主要是金融专家基于相关的理论基础,对于海量的金融信息报道,结合国家的宏观经济政策、投资环境与理念、上市公司及其产品服务等因素,对股市的行情进行全面的分析,对股市可能发生的异常波动作出分析和预警。但由于股票相关文本的数量庞大、实时性强,人工逐条阅读分析需要消耗巨大的人力资源,需要金融分析人员长时间、高频率地进行文本阅读,不仅效率低下,而且由于工作状态、个体情绪等人为因素,会对异动分析的准确度造成影响。显然,如果能够对股票文本的情感特征进行自动提取,挖掘情感特征与股票异常波动的关系,无疑将会对证券行业和股民的投资行为给予非常有意义的帮助。

发明内容

鉴于上述,本发明提供了一种基于舆论数据的股票异动分析方法,其建立了一套文本情感分析的模型,通过自然语言处理技术,提取海量的舆论数据的特征,挖掘出与特定的股票异常波动类型的特征,帮助领域专家和数据分析师分析股票的行情,帮助投资者获取关键信息,改善投资策略,并给定通用的方法,大大提高金融文本数据分析的效率,符合领域专家及投资者的需要。

一种基于舆论数据的股票异动分析方法,包括如下步骤:

(1)对舆论数据进行采集并通过预处理得到多个样本集,所述样本集为固定时间段内关于股票的所有文章及其评论集合,其中的样本即为关于任一股票的一篇文章及其评论;

(2)根据股票龙虎榜中的股票异动类型对样本进行类别标注,并将具有类别标注信息的样本分为训练集、验证集和测试集;

(3)获取金融领域词典、情感词典以及程度副词词典,根据上述词典或通过word2vec方法对样本进行分词,即将样本中的每个词转换成词向量形式,从而得到每个句子由词向量所组成的词向量矩阵;

(4)将一个样本中长度不同的句子所对应的词向量矩阵统一转换成固定维度大小的特征向量,进而将所有句子对应的特征向量合并后作为样本的特征向量;

(5)将同一天内关于同一股票的所有样本的特征向量级联拼接成一个特征向量X,进而将所有特征向量X输入至CNN(Convolutional Neural Networks,卷积神经网络)中,CNN的输出为对应一个日期戳(即一天)的特征向量Y;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810188058.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top