[发明专利]基于细粒度量化标注和集成方法的动态投资组合配置方法在审
| 申请号: | 202010659906.X | 申请日: | 2020-07-09 |
| 公开(公告)号: | CN111815458A | 公开(公告)日: | 2020-10-23 |
| 发明(设计)人: | 林鹏飞 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
| 主分类号: | G06Q40/06 | 分类号: | G06Q40/06;G06Q10/06;G06Q10/04 |
| 代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 陈艺文 |
| 地址: | 621000 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 细粒度 量化 标注 集成 方法 动态 投资 组合 配置 | ||
1.基于细粒度量化标注和集成方法的动态投资组合配置方法,其特征在于,包括:
完成细粒度的量化标注,为历史行情的任意时间点添加平均收益率标签;并对策略中的量化因子完成数据预处理和特征工程训练集成方法预测模型实现对平均收益率标签的预测;
在新的测试时间点,向训练好的模型传入处理完成后的因子特征,预测当前测试时间点的平均收益率,并计算出各个投资标的推荐仓位配置权重;以及
在迭代的过程中训练和更新预测模型,对新的时间点预测出相应的平均收益率,计算出新的时间点的投资组合配置权重,实现时序下对投资组合配置的动态更新。
2.如权利要求1所述的基于细粒度量化标注和集成方法的动态投资组合配置方法,其特征在于,具体包括以下步骤:
步骤1,训练集数据的时间周期区间为T0,T1,......,Tn,对该时间周期区间内的行情,以大小为R的移动窗口区间进行滚动采样,得到各个移动窗口内的最低价Li和最高价Hi;行情中成交价等于Li的时间点Tli作为做多标记,行情中成交价等于Hi的时间点Thi作为做空标记;
步骤2,对连续相邻的做多标记获取其成交价最低的标记,计算方法如下:
Lmin=min(Li,Li+1,......,Li+k)
式中,Li,Li+1,......,Li+k为移动窗口区间的做多标记,对相邻聚集的标记集合取最低成交价作为当前集合的最终做多标记Lmin;对连续相邻的做空标记获取其成交价最高的标记,计算方法如下:
Hmax=max(Hi,Hi+1,......,Hi+k)
式中,Hi,Hi+1,......,Hi+k为移动窗口区间的做空标记,对相邻聚集的标记集合取最高成交价作为当前集合的最终做空标记Hmax;完成以上步骤,即可得到独立无重复相邻的最佳多空点,分别标记为和
步骤3,从行情数据中分别得到最佳多空点的当前成交价Pli和Phi,并分别计算各多空点之间的时间周期ΔTlhi和ΔThli,从而计算每个时间粒度下的周期平均收益率,计算方法如下:
式中,Plhi为当前时间点的下一个多空点成交价,Pi为当前时间点的成交价,ΔTi,lhi为当前时间点到下一个多空点的时间周期,计算得到的即为该时间点的周期平均收益率;
步骤4,进行目标因子的研究,即机器学习中的特征工程;选取二级市场中对价格波动影响的指标;
步骤5,完成初步的数据获取后,对特征和标签基于时序先后进行匹配合并;
步骤6,完成特征和标签的匹配后,即可进行数据预处理,需要将分类变量转换为虚拟变量,即one-hot编码,从而将各个分类分离到不同的标记列,对相应分类标记为1,其他分类标记为0;对非正态分布且存在极大异常值的定量变量进行对数变换或Box-Cox变换,计算方法如下:
对数变换:
Box-Cox变换:
式中,xi是数据中的各个变量,为对数变换或Box-Cox变换过后的结果,Box-Cox变换中的λ是一个参数,该参数越小,对原始数据的缩放幅度就越大;变换类型和λ参数的选择需要基于权衡特征的偏态程度来确定;通过式中的计算,所有的xi将被转换至更加接近正态分布;完成数据变换后,再对数据进行标准化或归一化处理,计算方法如下:
标准化:
归一化:
式中,xi是数据中的各个变量,为标准化或归一化后的结果,标准化公式中,mean(x)是x变量集合的平均值,std(x)是x变量集合的标准差,归一化公式中,min(x)是x变量集合的最小值,max(x)是x变量集合的最大值;通过式中的计算,即可将所有的变量统一变换到相同的衡量单位和区间,从而标准化不同变量的度量基准;
步骤7,完成以上的数据变换过后,即可进行数据清洗,主要从正确性和完整性两个方面进行数据清洗;通过四分位距判断异常值,计算方法如下:
IQR=Q3-Q1
outlier=(-∞,Q1-IQR)OR(Q3+IQR,+∞)
式中,Q1和Q3分别是特征变量的二分位和四分位,IQR为四分位和二分位的差值,outlier即通过四分位距得到的异常值集合;对需要删除异常值的判断标准是“该异常值偏离异常值集合非常大,且分布数量不多,按照此标准删除特征变量中的异常值后,剩余的数据将用作进一步的特征工程;
步骤8,特征工程中,使用可视化分析挖掘和标签具有明显高相关性的特征,通过计算Pearson积矩相关系数,分析变量之间的线性相关性,计算方法如下:
式中,xi和yi分别是数据中相互对应的自变量和反应变量,即策略中的量化因子和周期平均收益率标注,和是数据中各个自变量和反应变量的均值;通过式中的计算,即可得到数据中各个自变量和反应变量相对其均值的标准差距离乘积,从而度量两个变量之间的线性相关性程度和方向,r即为相关系数,其范围为-1≤r≤1;对r取绝对值|r|,完成计算后,对排序后的|r|,根据数据的具体特性选择|r|相对更高的变量作为待选特征变量;
步骤9,对于高维特征,由于机器算力和多重共线性问题,使用方差膨胀因子分析并过滤待选特征变量中存在多重共线性的特征变量,从具有较高相关性的自变量中选择有效的特征,方差膨胀因子的计算方法如下:
式中,是以xi为因变量时对其他自变量回归的复测定系数,通过式中的计算,即可得到在该自变量和因变量组合下,自变量内部之间的相关性对因变量回归的影响程度,通过在多次的计算中删除VIF大于10的自变量中VIF最小的自变量,直到所有的自变量VIF都小于10,最终所得的自变量集合即为周期平均收益率预测的有效特征;
步骤10,完成数据的特征工程后,即可将数据按时序先后划分为训练集、验证集和测试集,传入集成方法模型进行训练;
步骤11,完成模型训练后,对二级市场后续演进,在新的时间点得到新的数据进行相同的预处理,并基于训练好的模型进行周期平均收益率预测,得到当前时间点投资组合中所有投资标的周期平均收益率(R1,R2,......,Rn),过滤出所有R>0的周期平均收益率,计算各个投资标的推荐仓位配置权重,计算方法如下:
式中,Ri为满足Ri>0的所有投资标的预测周期平均收益率,计算得到的Wi即为各个投资标的在该时间点的推荐仓位配置权重,策略研究者或投资者即可根据当前时间点的推荐仓位配置权重对投资组合进行调仓优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010659906.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防弹单元及其制造工艺
- 下一篇:一种环境保护用沙漠固沙装置





