[发明专利]一种基于人工智能的股票价格预测方法及系统在审
申请号: | 201711294176.2 | 申请日: | 2017-12-08 |
公开(公告)号: | CN108022016A | 公开(公告)日: | 2018-05-11 |
发明(设计)人: | 张潇 | 申请(专利权)人: | 宏谷信息科技(珠海)有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/02;G06Q40/04 |
代理公司: | 杭州千克知识产权代理有限公司 33246 | 代理人: | 郭扬部 |
地址: | 519031 广东省珠海市横琴新区环岛东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 股票价格 预测 方法 系统 | ||
本发明公开了一种基于人工智能的股票价格预测方法及系统,用以解决现有的股票预测的考虑因素具有片面性的问题。该方法包括:获取预设时间内交易日的股票价格特征及股票新闻特征;将所述股票价格特征及所述股票新闻特征输入双向循环神经网络模型进行训练;将所述双向循环神经网络模型输出的混合特征向量输入多层感知机进行分类训练;根据所述多层感知机的输出预测下一个交易日的股票价格。本发明基于双向循环网络的框架,通过将价格特征与新闻特征结合,充分利用获取的数据信息,更加准确地对股票价格进行预测。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的股票价格预测方法及系统。
背景技术
股票价格预测是指利用价格的历史信息以及股票相关的市场信息,预测股票在未来一段时间的涨跌情况或者价格情况。近几年来,深度学习方法在自然语言处理领域取得了许多进展。深度学习方法也逐渐运用到股票预测领域。
Fama于1965年提出了有效市场假说,认为股票市场是一个“有效信息”市场,股票价格充分反映了已经发生的事件,以及那些尚未发生但市场预期会发生的事件对股票价格的影响。这一假设为之后的股票预测工作提供了依据。
然而,预测股票价格依旧十分困难,因为股票价格受到众多因素的影响,对于单个股票而言,除了国家的货币政策,行业的景气状况等宏观因素,股票上市公司的相关事件等微观因素也会对股票价格产生影响。因此,除了股票自身的价格信息,许多相关工作都将股票的相关新闻信息作为预测股票价格的重要依据。
GPC Fung等在文献[Stock prediction:Integrating text mining approachusing real-time news]中利用实时的新闻信息对股票价格作出预测。他们首先利用线性回归和聚类方法对股票的价格曲线分段,每段时间区间对应价格的上升期和下降期。然后将上升期和下降期内的新闻分别标注为利好消息和利空消息。通过统计方法选择出新闻中的利好和利空特征。最后依据这些新闻中的特征对股票价格的涨跌做出预测。但是该方法忽视了新闻对于股价影响的持续性。
TH Nguyen等利用主体模型来预测股票价格。在文献[Topic modeling basedsentiment analysis on social media for stock market prediction]中,他们提出一个融合情感和话题的主题模型,并将该模型运用到股票相关新闻的主体分析中。在获得了每个新闻的主题分布向量后,他们将这个主题向量加入到股票预测的特征中,最终获得了不错的预测效果。但是却忽略了金融领域本身独有的特征。
Xiao Ding等将深度学习方法运用到股票预测领域。在文献中,他们提出了一种新的事物抽取方法,从新闻中抽取出结构化的事件。这些结构化的事件成为神经网络的输入,用于预测股票价格。随后,在时间抽取工作的基础上,他们在文献中进一步学习出结构化时间的event embedding,并使用卷积神经网络去预测股票价格。但是忽略了多个时间对于股价的综合作用。
除了与股票相关的新闻信息,大众媒体与社交媒体上的内容也被用于股票预测。Johan Bollen等在文献[Twitter mood predicts the stock market]中运用Twitter上的内容对股市的涨跌作出预测。他们使用OpinionFinde等工具分析Twitter上每天的大众情感,然后将这些情感特征加入到预测模型中,对股市的涨跌作出预测。但是只能对股市整体的情况作出预测,不适用于单个股票的预测。
股票相关的新闻信息通常与股票本身的发展形势较为相关,也容易包含一些利好极性的术语等,因此Zeya Zhang等人在相关工作[Stock prediction:a method based onextraction of news features and recurrent neural networks]中使用了新闻的利好极性区间分布作为其特征,并与历史价格信息一并放入循环神经网络中进行计算。但是新闻文本中含着丰富的信息,仅从利好极性去考虑并不充分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宏谷信息科技(珠海)有限公司,未经宏谷信息科技(珠海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711294176.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理