[发明专利]股票收益率预测方法、装置、电子设备及介质在审
| 申请号: | 202210002469.3 | 申请日: | 2022-01-04 |
| 公开(公告)号: | CN114330918A | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 李胜浩;吴皓;李孜;杨帆 | 申请(专利权)人: | 工银瑞信基金管理有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q40/04;G06Q40/06;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 李世阳 |
| 地址: | 100033 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 股票 收益率 预测 方法 装置 电子设备 介质 | ||
1.一种股票收益率预测方法,包括:
获取多个历史时段的原始股票特征数据,将所述原始股票特征数据拆分为训练数据集和测试数据集;
对所述训练数据集进行特征工程处理,得到标准样本集;
根据预设分批策略对所述标准样本集进行分批,得到每批标准样本集;
分别以按日分批的收益率的秩和隐因子层的相关系数为目标函数,将所述每批标准样本集输入股票收益率预测模型进行训练,得到训练好的股票收益率预测模型。
2.根据权利要求1所述的方法,其中,所述原始股票特征数据包括原始量价数据、中间特征数据和未定义因子数据,其中:
所述原始量价数据包括开盘价、收盘价、当日最高价、当日最低价、成交量加权平均价、换手率和交易量;
所述中间特征数据包括动量、变异系数、偏度和峰度系数;
所述未定义因子数据通过因子搜索算法挖掘得出。
3.根据权利要求1所述的方法,其中,所述特征工程处理依次包括:
将所述训练数据集按照时间顺序进行排序;
利用极值推压方法剔除所述训练数据集中的部分极值;
将剔除极值后的训练数据集通过标准化转换为服从标准正态分布的标准数据集;
按照日期截面对所述标准数据集进行标准化,得到标准样本集。
4.根据权利要求3所述的方法,其中,所述极值推压方法包括以下步骤:
将所述训练数据集表示为原矩阵,计算所述原矩阵的中值矩阵和中值距离矩阵;
根据所述中值矩阵和中值距离矩阵,确定特征最大值矩阵和特征最小值矩阵;
对所述原矩阵按照所述特征最大值矩阵和特征最小值矩阵进行裁剪,得到线性矩阵和差异矩阵;
利用指数函数为所述差异矩阵赋值非线性权重,根据所述线性矩阵、差异矩阵以及所述差异矩阵的非线性权重,确定剔除极值后的训练数据集。
5.根据权利要求4所述的方法,其中,所述剔除极值后的训练数据集根据以下公式计算得出:
lower=median-3×distmedian
upper=median+3×distmedian
linear=clip(lower,upper)
diff=source-linear
nonlinearweights=1-(alphadiff)2
ret=linear+diff×nonlinearweights
式中,source表示原矩阵;median表示中值矩阵;distmedian表示中值距离矩阵;lower表示特征最大值矩阵;upper表示特征最小值矩阵;linear表示线性矩阵;clip(lower,upper)表示在输入阈值处修剪值,以将边界外的值指定给边界值lower或者upper;diff表示差异矩阵;nonlinearweights表示非线性权重;alpha表示股票阿尔法因子;ret表示剔除极值后的训练数据集矩阵。
6.根据权利要求1所述的方法,其中,所述根据预设分批策略对所述标准样本集进行分批,得到每批标准样本集,包括以下方式的至少一种:
将所述标准样本集通过map-type方式提取日期截面数据作为分批的标准样本集;
预先采用多进程异步加载分批的标准样本集。
7.根据权利要求1所述的方法,其中,所述以按日分批的收益率的秩为目标函数,还包括:
将所述目标收益率按照预设日期截面进行等级预分箱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于工银瑞信基金管理有限公司,未经工银瑞信基金管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210002469.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





