[发明专利]训练样本生成方法、机器学习模型训练方法及相关装置在审
申请号: | 202011241499.7 | 申请日: | 2020-11-09 |
公开(公告)号: | CN112364077A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 张轶;杨光;杨雪松 | 申请(专利权)人: | 光大理财有限责任公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62;G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张静 |
地址: | 266000 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 样本 生成 方法 机器 学习 模型 相关 装置 | ||
本申请提供了一种训练样本生成方法、机器学习模型训练方法及相关装置,训练样本生成方法通过判断包含历史信息的收益率时间序列是否符合平稳性要求,及确定线性相关系数,对滑动平均函数的参数进行更新,并生成新的包含历史信息的收益率时间序列,直至符合稳定性要求且大于预设阈值时,停止更新参数及变换,保证得到的包含历史信息的收益率时间序列既能保留历史信息,并能保持平稳性及和变换前的收益率时间序列线性相关,提高训练样本的可靠性,进一步提高对机器学习模型进行训练的准确性。
技术领域
本申请涉及数据处理技术领域,特别涉及一种训练样本生成方法、机器学习模型训练方法及相关装置。
背景技术
在时间序列分析领域,资产价格序列在不同时间段往往不具有可比性,因此,通常使用通过价格差分得到的收益率时间序列,收益率时间序列具有良好的平稳性特征,是其作为训练模型输入参数的必要条件。
但是,收益率时间序列的计算过程只涉及到前后两个时间点(如,T和T-1两个时间点)的信息,导致收益率时间序列的历史信息特征不足,进而导致基于收益率时间序列训练出的机器学习模型的准确性不高。
发明内容
为解决上述技术问题,本申请实施例提供一种训练样本生成方法、机器学习模型训练方法及相关装置,以达到对增加收益率时间序列的历史信息,提高机器学习模型的准确性的目的,技术方案如下:
一种训练样本生成方法,包括:
获取收益率时间序列,并初始化滑动平均函数;
利用所述滑动平均函数对所述收益率时间序列进行变换,得到包含历史信息的收益率时间序列;
判断所述包含历史信息的收益率时间序列是否符合平稳性要求;
若不符合所述平稳性要求,则更新所述滑动平均函数的参数,并返回执行所述利用所述滑动平均函数对所述收益率时间序列进行变换的步骤;
若符合平稳性要求,则确定所述包含历史信息的收益率时间序列与所述收益率时间序列之间的线性相关系数;
判断所述线性相关系数是否大于预设阈值;
若大于所述预设阈值,则将所述包含历史信息的收益率时间序列作为训练样本;
若不大于所述预设阈值,则返回执行所述利用所述滑动平均函数对所述收益率时间序列进行变换的步骤。
所述利用所述滑动平均函数对所述收益率时间序列进行变换,包括:
利用EWMA变换函数yt=αxt+(1-α)yt-1,分别对所述收益率时间序列中每个收益率值进行变换,得到变换后的收益率值,其中,,yt表示t时刻的变换后的收益率值,yt-1表示t-1时刻是变换后的收益率值,xt表示所述收益率时间序列中的其中一个收益率值,α表示衰减参数;
将多个所述变换后的收益率值组成的序列作为包含历史信息的收益率时间序列。
所述利用所述滑动平均函数对所述收益率时间序列进行变换,包括:
利用自定义变换函数分别对所述收益率时间序列中每个收益率值进行变换,得到变换后的收益率值,其中,yt表示变换后的收益率值,ωi表示权重且ωi通过计算得到,i为小于t的整数,yt-1表示所述收益率时间序列中的其中一个收益率值,d表示衰减参数;
将多个所述变换后的收益率值组成的序列作为包含历史信息的收益率时间序列。
所述判断所述包含历史信息的收益率时间序列是否符合平稳性要求,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于光大理财有限责任公司,未经光大理财有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011241499.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种断层三维数字化检测方法
- 下一篇:一种反光膜组分及其制备方法