[发明专利]基于遗传算法与长短时神经网络的股票价格预测方法在审
申请号: | 202011256979.0 | 申请日: | 2020-11-11 |
公开(公告)号: | CN112419056A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 周昌军;陈诗乐 | 申请(专利权)人: | 浙江师范大学 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q30/02;G06N3/12;G06N3/04 |
代理公司: | 杭州轩皓知识产权代理有限公司 33271 | 代理人: | 殷筛网 |
地址: | 321000 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 遗传 算法 长短 神经网络 股票价格 预测 方法 | ||
本发明是基于遗传算法(GA)对海量股票因子进行特征选择,选出适合当前情景的最优因子组合,并采用长短时神经网络模型(LSTM)进行深度学习,实现对股票价格的高精度预测。遗传算法基于自然选择和遗传进化思想引入自适应启发式搜索机制,寻找具有大搜索空间的优化问题的近似最优解。种群繁衍过程中,借助自然遗传学的遗传算子进行组合交叉和变异,按照适者生存和优胜劣汰的原理,逐代演化产生出越来越好的近似解。长短时神经网络模型因其具有长时间记忆性被广泛运用于时序预测模型中,通过深度学习寻找股票因子与股票价格之间复杂的非线性关系能够有效提高预测精度。
技术领域
本发明涉及深度学习领域,构建了基于遗传算法和长短时神经网络的股票价格预测方法,能够有效提高股票预测精度。
背景技术
随着社会经济的飞速发展,上市公司的数量越来越多,股票因而成为金融领域的热门话题之一,股票的变化趋势往往在一定程度上影响着诸多经济行为的走向,因此股票价格的预测也受到越来越多学者的关注。影响股票价格的因素众多,随着统计技术在金融领域的日趋成熟,金融学者们挖掘了大量的股票市场的影响因子,并将它们量化为具体的数据用于对股票变化趋势的研究。
拥有海量的金融数据作为支撑,为机器学习算法的实现提供了可能,越来越多的研究人员开始使用机器学习非线性预测模型对股票价格进行预测。随机森林和支持吃向量机是两种在机器学习领域取得成熟发展的机器学习技术。随机森林属于集成学习具有运算速率快、抗干扰能力强、精确率高等特点,支持向量机基于结构风险最小化的方法能够在很大程度上降低了模型陷入局部最优的可能性,这两项机器学习技术均被广泛运用于金融时序预测领域。
对于多变量金融时序预测,有效的特征选择十分重要,在选择关键特征的同时去除冗余特征,能够有效提高模型的泛化能力。传统的特征选择方法主要有过滤法、嵌入法和包装法。然而,股票预测的特征选择研究还没有得到学者们足够的重视。本专利提出的遗传算法能够有效的得对股票多因子数据进行特征选择,找出符合当前情景得优化多因子组合。
金融数据在更新过程中,数据同时还具有两个特性。一是时效性。所谓时效性是指数据随着时间的推移而数据对预测目标的贡献会逐渐失效。二是差异性。通常来说,新数据比旧数据更能反映当前数据的特点及变化趋势,则新数据比旧数据对预测目标的贡献要大。差异性是指有效数据因新旧程度对预测检测系统的贡献不同。随机森林和支持向量机算法无法解决金融数据的时效性和差异性。为了解决金融数据的时效性和差异性,提出在特征选择之后使用长短时神经网络(LSTM)对输入数据进行模型训练。
发明内容
本发明的目的在于提高股票价格的预测精度。将多因子模型引入到股票预测中,股票市场具有海量的描述股票价格行情变化的股票因子,这些因子均为较为常用的典型的股票因子,但是典型并不意味着能够适用于所有的情况,本发明提出了一种遗传算法在初期对大量因子进行特征选择,遴选出更为适合当前场景的因子并结合LSTM深度学习网络模型挖掘因子与股票之间复杂的非线性关系从而进行股票价格预测工作。
本发明包括初阶段和模型训练阶段,具体步骤如下:
阶段I:初始阶段
初始数据集
第1步:首先,为每条用于表示问题潜在解的染色体设计二进制编码。形如[1,0,0,1,0,1……],1代表选取该因子,0代表不选,染色体长度为N。随机生成M条染色体初始化种群;
第2步:计算每条染色体适应度函数,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江师范大学,未经浙江师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011256979.0/2.html,转载请声明来源钻瓜专利网。