[发明专利]一种基于改进的支持向量机股票收益率预测方法在审

专利信息
申请号: 201910298961.8 申请日: 2019-04-15
公开(公告)号: CN110163412A 公开(公告)日: 2019-08-23
发明(设计)人: 方昕;陈玲玲 申请(专利权)人: 杭州电子科技大学
主分类号: G06Q10/04 分类号: G06Q10/04;G06Q40/04;G06N3/00;G06N20/10
代理公司: 杭州君度专利代理事务所(特殊普通合伙) 33240 代理人: 朱月芬
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于改进的支持向量机股票收益率预测方法,使用步骤如下:S1,支持向量机对股票收益率进行分类预测时,无法识别和选择高效的特征,结合BPSO优化特征选择机制,选择最优特征,并作为特征属性输入SVM算法;S2,SVM算法存在参数选择困难问题,利用粒子群算法搜索SVM参数,提出改进支持向量机进行股票趋势预测的混合分类方法;本发明消除无关或效果重复的特征属性,减少输入特征的维度,减小了股票趋势预测的时间;提高支持SVM的分类预测性能。采用BPSO算法帅选出最优特征作为输入变量输入到粒子群优化的SVM算法中,有效提高了股票趋势预测的精确性,大大降低了输入技术指标的复杂性。
搜索关键词: 支持向量机 股票 趋势预测 特征属性 分类 预测 粒子群算法 粒子群优化 改进 参数选择 困难问题 输入变量 输入技术 输入特征 特征选择 预测性能 减小 维度 算法 搜索 重复 优化
【主权项】:
1.一种基于改进的支持向量机股票收益率预测方法,其特征在于,具体包括以下步骤:S1,数据采集:使用python程序从网站下载股票日交易数据;S2:特征提取:计算技术指标,用股票技术分析中的技术指标作为支持向量机的输入特征;S3:粒子群种群初始化:将技术指标作为粒子群算法中的粒子,随机初始化粒子的速度与位置,皆用二进制码表示;假设粒子的种群规模为F,粒子群搜索空间维度为d,d也为特征数量;粒子在空间的位置向量为代表特征的位置向量,速度向量为代表特征的速度向量,i=1,2,3……F;S4:通过BPSO特征选择和SVM参数寻优:将二进制粒子群算法BPSO中粒子的初始速度与位置随机分配,粒子的个体最优位置记为群体的历史最优位置记为设目标函数为f(.),个体历史最优位置的迭代公式如下:其中t表示迭代次数;粒子的速度更新公式:粒子调整空间位置如下:其中,分别对应第i个粒子在第t次迭代中的速度、位置、局部最优位置、全局最优位置;w是惯性权重,C1,C2是学习因子,且为正数;S函数随机均匀分布,调整空间位置是将粒子速度映射到[0,1]之间,并与随机数比较,更新粒子的位置状态;粒子位置每一维的取值被限制在区间[‑Xmax,Xmin]上,粒子的速度被限制在[‑Vmax,Vmin]上,Vmax=βXmax;Xmax表示位置更新的最大值,Xmin表示位置更新的最小值,Vmax为速度更新的最大值,Vmin为速度更新的最小值,β为任意常数;采用RBF函数作为SVM的核函数,RBF函数定义如式:K(x,y)=exp(‑γ||x‑y||2),γ>0    (5)SVM需要优化两个参数,核参数γ>0和误差项的惩罚参数C>0,粒子中也应当包含这两个参数;粒子中有两个子串分别用于编码C和γ;假设子串S用于编码C和γ,S的长度为L,S所代表的无符号整数值是i,C和γ的取值范围是[Cmin,Cmax]和[γminmax],则参数C和γ的真实值是由下式确定;粒子中还有一个子串用于编码特征信息,即特征掩码;特征掩码的某一位是1表示相应的特征被选中,是0表示相应的特征不被选中;粒子的结构图如下所示,它由三部分组成:编码参数C的子串长度为nc,编码参数γ的子串长度为nγ,以及特征掩码子串长度为nF,nc和nγ决定了编码参数C、γ的精度,nF由分类问题的特征数决定;粒子的结构图S5:设定粒子群判定条件:设定两个条件:(1)如果迭代次数超过设置的最大迭代次数,则跳出循环;(2)若适应度值满足确定的最小界限,则跳出循环;S6:构建数据矩阵:由前面粒子群算法选中的特征子集构成特征矩阵;S7:训练集进行交叉验证:将数据的训练验证部分数据进行K折交叉验证,进行参数寻优;将数据分为k个子集,粒子群优化的SVM算法在每个数据集上运行k次,每次取一个子集作为验证集,其余训练SVM,然后取k次实验结果的平均值作为该数据集的分类结果;S9:将交易信号构建为标签:将粒子群选取的特征通过以下方式构建作为标记的交易信号:Yj={y1,y2,…,yj},其中j=1,2,…,n为样本数;交易信号的具体构建步骤如下:1)计算日均价格Pi其中Cj表示股票收盘价,Hj表股票最高价,Lj表示最低价,Oi表示开盘价;2)计算未来k天的算数收益率Vj,k=1,2,…,10;3)构建交易信号YiS10:样本内训练:将由最优特征构造的数据输入到支持向量机训练算法模型,并用粒子群对支持向量机进行同步参数寻优,并与实际股票趋势进行比较,得出股票预测的趋势以及预测的准确性;S11:适应度值评估:根据支持向量机算法分类过程中,得到混淆矩阵,如下表1所示:表1混淆矩阵其中TP为被模型预测为正的正样本,FP为被模型预测为正的负样本,FN为被模型预测为负的正样本,TN为被模型预测为负的负样本,N=TP+FN+FP+TN表示样本总量;分类精度Accuracy表示分类的正样本占总样本的比率,计算公式如下:灵敏度Sensitivity表示分类的正样本占真实的正样本的比率,计算公式如下:Sensitivity=TP/(TP+FN)    (12)查准率Precision表示被正确分类的正样本占预测为正样本的比例,计算公式如下:Precision=TP/(TP+FP)(13)F值用来评价数据集的有效综合性能指标,即灵敏度和查准率的加权平均值,F值越趋近于1表示分类结果越好,公式如下:以适应度值由Accuracy与feature_num组成,值越大越好,公式如下:其中,feature_num表示通过特征选择所选择的特征数目;wa和wf分别是上述两个因素的权重,满足wa+wf=1;S12:样本外测试:用测试数据来测试前面特征处理和参数优化的支持向量机算法模型,得到每个样本的T+k天的预测值得到分类结果,并与实际股票价格趋势对比,通过混淆矩阵,计算得出股票趋势预测的准确性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910298961.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top