[发明专利]一种基于改进的支持向量机股票收益率预测方法在审
申请号: | 201910298961.8 | 申请日: | 2019-04-15 |
公开(公告)号: | CN110163412A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 方昕;陈玲玲 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/04;G06N3/00;G06N20/10 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于改进的支持向量机股票收益率预测方法,使用步骤如下:S1,支持向量机对股票收益率进行分类预测时,无法识别和选择高效的特征,结合BPSO优化特征选择机制,选择最优特征,并作为特征属性输入SVM算法;S2,SVM算法存在参数选择困难问题,利用粒子群算法搜索SVM参数,提出改进支持向量机进行股票趋势预测的混合分类方法;本发明消除无关或效果重复的特征属性,减少输入特征的维度,减小了股票趋势预测的时间;提高支持SVM的分类预测性能。采用BPSO算法帅选出最优特征作为输入变量输入到粒子群优化的SVM算法中,有效提高了股票趋势预测的精确性,大大降低了输入技术指标的复杂性。 | ||
搜索关键词: | 支持向量机 股票 趋势预测 特征属性 分类 预测 粒子群算法 粒子群优化 改进 参数选择 困难问题 输入变量 输入技术 输入特征 特征选择 预测性能 减小 维度 算法 搜索 重复 优化 | ||
【主权项】:
1.一种基于改进的支持向量机股票收益率预测方法,其特征在于,具体包括以下步骤:S1,数据采集:使用python程序从网站下载股票日交易数据;S2:特征提取:计算技术指标,用股票技术分析中的技术指标作为支持向量机的输入特征;S3:粒子群种群初始化:将技术指标作为粒子群算法中的粒子,随机初始化粒子的速度与位置,皆用二进制码表示;假设粒子的种群规模为F,粒子群搜索空间维度为d,d也为特征数量;粒子在空间的位置向量为![]()
代表特征的位置向量,速度向量为
代表特征的速度向量,i=1,2,3……F;S4:通过BPSO特征选择和SVM参数寻优:将二进制粒子群算法BPSO中粒子的初始速度与位置随机分配,粒子的个体最优位置记为
群体的历史最优位置记为
设目标函数为f(.),个体历史最优位置的迭代公式如下:
其中t表示迭代次数;粒子的速度更新公式:
粒子调整空间位置如下:![]()
其中,
分别对应第i个粒子在第t次迭代中的速度、位置、局部最优位置、全局最优位置;w是惯性权重,C1,C2是学习因子,且为正数;S函数随机均匀分布,调整空间位置是将粒子速度映射到[0,1]之间,并与随机数比较,更新粒子的位置状态;粒子位置每一维的取值被限制在区间[‑Xmax,Xmin]上,粒子的速度被限制在[‑Vmax,Vmin]上,Vmax=βXmax;Xmax表示位置更新的最大值,Xmin表示位置更新的最小值,Vmax为速度更新的最大值,Vmin为速度更新的最小值,β为任意常数;采用RBF函数作为SVM的核函数,RBF函数定义如式:K(x,y)=exp(‑γ||x‑y||2),γ>0 (5)SVM需要优化两个参数,核参数γ>0和误差项的惩罚参数C>0,粒子中也应当包含这两个参数;粒子中有两个子串分别用于编码C和γ;假设子串S用于编码C和γ,S的长度为L,S所代表的无符号整数值是i,C和γ的取值范围是[Cmin,Cmax]和[γmin,γmax],则参数C和γ的真实值是由下式确定;![]()
粒子中还有一个子串用于编码特征信息,即特征掩码;特征掩码的某一位是1表示相应的特征被选中,是0表示相应的特征不被选中;粒子的结构图如下所示,它由三部分组成:编码参数C的子串长度为nc,编码参数γ的子串长度为nγ,以及特征掩码子串长度为nF,nc和nγ决定了编码参数C、γ的精度,nF由分类问题的特征数决定;粒子的结构图
S5:设定粒子群判定条件:设定两个条件:(1)如果迭代次数超过设置的最大迭代次数,则跳出循环;(2)若适应度值满足确定的最小界限,则跳出循环;S6:构建数据矩阵:由前面粒子群算法选中的特征子集构成特征矩阵;S7:训练集进行交叉验证:将数据的训练验证部分数据进行K折交叉验证,进行参数寻优;将数据分为k个子集,粒子群优化的SVM算法在每个数据集上运行k次,每次取一个子集作为验证集,其余训练SVM,然后取k次实验结果的平均值作为该数据集的分类结果;S9:将交易信号构建为标签:将粒子群选取的特征通过以下方式构建作为标记的交易信号:Yj={y1,y2,…,yj},其中j=1,2,…,n为样本数;交易信号的具体构建步骤如下:1)计算日均价格Pi
其中Cj表示股票收盘价,Hj表股票最高价,Lj表示最低价,Oi表示开盘价;2)计算未来k天的算数收益率Vj,k=1,2,…,10;
3)构建交易信号Yi
S10:样本内训练:将由最优特征构造的数据输入到支持向量机训练算法模型,并用粒子群对支持向量机进行同步参数寻优,并与实际股票趋势进行比较,得出股票预测的趋势以及预测的准确性;S11:适应度值评估:根据支持向量机算法分类过程中,得到混淆矩阵,如下表1所示:表1混淆矩阵
其中TP为被模型预测为正的正样本,FP为被模型预测为正的负样本,FN为被模型预测为负的正样本,TN为被模型预测为负的负样本,N=TP+FN+FP+TN表示样本总量;分类精度Accuracy表示分类的正样本占总样本的比率,计算公式如下:
灵敏度Sensitivity表示分类的正样本占真实的正样本的比率,计算公式如下:Sensitivity=TP/(TP+FN) (12)查准率Precision表示被正确分类的正样本占预测为正样本的比例,计算公式如下:Precision=TP/(TP+FP)(13)F值用来评价数据集的有效综合性能指标,即灵敏度和查准率的加权平均值,F值越趋近于1表示分类结果越好,公式如下:
以适应度值由Accuracy与feature_num组成,值越大越好,公式如下:
其中,feature_num表示通过特征选择所选择的特征数目;wa和wf分别是上述两个因素的权重,满足wa+wf=1;S12:样本外测试:用测试数据来测试前面特征处理和参数优化的支持向量机算法模型,得到每个样本的T+k天的预测值得到分类结果,并与实际股票价格趋势对比,通过混淆矩阵,计算得出股票趋势预测的准确性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910298961.8/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理