[发明专利]一种基于深度学习的股票市场预测方法在审
申请号: | 201711232195.2 | 申请日: | 2017-11-30 |
公开(公告)号: | CN107832897A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 张元鸣;沈志鹏;蒋建波;肖刚;高飞;陆佳炜;徐俊 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/02;G06Q40/04;G06N3/04 |
代理公司: | 杭州天正专利事务所有限公司33201 | 代理人: | 王兵,黄美娟 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于深度学习的股票市场价格预测方法,包括数据预处理、构建LSTM‑DCC股票市场预测模型。本发明结合了扩张因果卷积网络和循环神经网络各自的优势,能够自动学习股票自身序列以及相关影响因素的数据特征,对未来的价格及其走势进行预测。 | ||
搜索关键词: | 一种 基于 深度 学习 股票 市场预测 方法 | ||
【主权项】:
一种基于深度学习的股票市场预测方法,包括以下步骤:(1)数据预处理;(1.1)特征筛选;计算影响因素与股票市场时间序列的相关性,采用Pearson相关系数作为评价依据,Pearson相关系数用以度量两个变量之间的相关程度其计算公式如下:r=Cov(x,y)σxσy---(1)]]>其中r表示Pearson相关系数,取值范围为[‑1,1],其中0表示不相关,其值越接近1则正相关性越大,越接近‑1则是负相关性越大;x和y为两个数据特征变量;Cov(x,y)表示协方差,σx,σy表示标准差;通过以上计算结果可以知道两个数据特征变量之间的相关程度,如上证指数与美国市场标普500的相关程度、上证指数与人民币‑美元汇率的相关程度、上证指数与恒生指数的相关性;Pearson相关系数的绝对值越接近0则相关程度越弱,r的值作为特征选择的依据,剔除弱相关性的相应特征即相关系数r的绝对值小于0.3;(1.2)归一化处理;由于股票市场序列数据与其他影响因素数据在数值上相差较大且有较到的波动,故必须对这些数据进行归一化处理,其方法是将各类数值缩放到同一尺度,其计算公式如下:x*=x-xminxmax-xmin---(2)]]>其中x为原始数值,xmin为当前维度所有数据中数值最小的值,xmax为当前维度所有数据中数值最大的值,x*为缩放后的数值;(2)构建LSTM‑DCC股票市场预测模型;将长短期记忆网络LSTM和扩张因果卷积网络DCC相结合,设计了一种混合深度学习模型,称为LSTM‑DCC网络,LSTM的任务是提取序列的粗粒度特征,并降低输入数据特征维度,DCC网络通过扩张卷积操作可以同时利用不同时间间隔长度的序列特征;设股票市场时间序列数据为X=(xt,x2,...,xt‑1,xt),xt是t时刻的股票市场,则股票市场预测问题即是根据已知时间序列数据X,求得xt+1时刻的最大似然估计p(x):p(X)=Πt=1Tp(xt+1|x1,x2,...,xt)---(3)]]>xt+1时刻的值将会完全利用到序列之前所有时间步信息;针对多条件股票市场序列数据,则此时公式(3)以如下形式进行表示:p(X|y)=Πt=1Tp(xt+1|x1,x2,...,xt,y11,y12,...,yit)---(4)]]>其中xt表示t时刻股市场,表示t时刻的第i个影响因素数据的值,则i=1,2,3,...,n表示有n个条件;公式(3)与公式(4)是股票市场的预测目标,利用LSTM网络初步提取时间序列特征,将多变量时间序列输入通过LSTM网络降维后与DCNN网络连接,其t时刻计算过程如下:it=sigmoid(Wxixt+Whiht‑1+Wcict+bi) (5)ft=sigmoid(Wxfxt+Whfht‑1+Wcfct+bf) (6)ct=ftct‑1+ittanh(Wxcxt+Whcht‑1+bc) (7)ot=sigmoid(Wxoxt+Whoht‑1+Wcoct+bo) (8)ht=ottanh(ct) (9)其中xt表示t时刻的输入,it,ft,ot分别表示t时刻输入门、遗忘门、输出门的输出,ct表示t时刻记忆单元cell的输出,ht表示t时刻隐层输出,Wxi表示从输入层到输入门的连接权重,Whi表示从隐藏层到输入门的连接权重,Wci表示从记忆单元到输入门的连接权重,bi为其偏置项,Wxf表示从输入层到遗忘门的连接权重,Whf表示从隐藏层到遗忘门的连接权重,Wcf表示从记忆单元到遗忘门的连接权重,bf为其偏置项,Wxc表示从输入层到记忆单元的连接权重,Whc表示从隐藏层到记忆单元的连接权重,bc为其偏置项,Wxo表示从输入门到输出层的连接权重,Who表示从隐藏层到输出门的连接权重,Wco表示从记忆单元到遗忘门的连接权重,bo为其偏置项,根据it,ft,ot在[0,1]范围的取值,来控制历史信息在t时刻通过门结构的比例,sigmoid和tanh为激活函数。以公式(8)的输出ht=ottanh(ct)作为DCCN部分的输入,扩张因果卷积神经网络利用禅茶学习通过堆叠残差连接块加深网络的深度,从而使网络可以获得更大的接受域,同时可以很好检测出数据微小的扰动;在残差连接块的每层输入后使用批规范化,对每一层的输入重新进行归一化,避免极深网络而引起的梯度消失,使得网络可以很好的被训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711232195.2/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理