[发明专利]一种基于元学习和改进的Catboost算法的债券违约预测方法在审
申请号: | 202210502069.9 | 申请日: | 2022-05-10 |
公开(公告)号: | CN114881797A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 张永全;杨秀银;武鑫 | 申请(专利权)人: | 浙江财经大学 |
主分类号: | G06Q40/06 | 分类号: | G06Q40/06;G06Q10/04;G06K9/62 |
代理公司: | 杭州兴知捷专利代理事务所(特殊普通合伙) 33338 | 代理人: | 林振兴 |
地址: | 310012 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 学习 改进 catboost 算法 债券 违约 预测 方法 | ||
本发明涉及一种债券违约预测识别的技术,具体涉及一种基于元学习和改进的Catboost算法的债券违约预测方法,属于金融信息数据管理技术。首先经过K近邻算法进行缺失值填补和标准化处理,然后利用基于元学习框架的显式梯度学习数据增强方法对不平衡数据进行处理,得到经过不平衡处理后的数据,接着利用相关分析和随机森林算法进行特征筛选,最后利用以改进的GHMNALoss为损失函数的Catboost算法模型进行训练,得到每个债券的违约预测结果。本发明能避免对不平衡数据集导致的债券违约预测效果不佳的问题,并对不同类型的债券违约预测都能达到较好的结果。
技术领域
本发明涉及一种债券违约预测识别的技术,具体涉及一种基于元学习和改进的Catboost算法的方法,属于金融信息数据管理技术。
背景技术
违约风险处于历史最高水平,债券展期规模大幅增加,债券市场总体的信用风险水平也相对增加,债券的违约形式也不断多样化。截止2021年末,从债券规模来看,我国债券市场中公司债规模居首,占比将近61%,从违约规模来看,2021年的违约债券仍延续往年,以公司债、私募债居多,二者合计占比约62%,从债券违约数据的不平衡程度来看,正负例之间的比例超过1:100,具有严重的不平衡问题。因此,债券违约数据具有严重的不平衡程度,结合现实意义和数据特点,对债券违约预测进行研究是十分有意义的。目前,许多研究者在债券违约方面做了大量的研究,提出了许多实用的识别方法,主要包括:
(1)专利《一种信用评级违约概率测度与风险预警方法》(公开号 CN110110981A)考虑了非信用因素波动对违约概率的影响,添加了定性指标建立了一个综合的指标体系,并借助了数据挖掘技术构建了一个违约损失率预测模型和二元响应风险预警模型,对信用评级的数学模型进行了改进研究与应用,并利用机器学习当中的监督学习的分类思想建立了评价预警系统,实现了预测策略。
缺点:由于该方法对债券违约概率进行测度,并没有考虑债券数据级本身的不平衡情况对机器学习模型的影响,不平衡数据会大大较低模型的表现效果。
(2)专利《基于信用等级与违约损失率匹配的信用评级系统与方法》(公开号CN102779317A)从信用的本质出发,提供了一致信用等级越高、违约概率越低的信用本质属性的信用评级系统和方法,利用信用等级与违约损失率匹配的信用等级划分优化算法,求解数学规划模型,进行客户的信用评级。
缺点:虽然考虑了信用的本质属性,但是引用指标比较单一,主要是一些数值型变量,且没有考虑数据集本身的不平衡问题。
发明内容
本发明的目的是提供一种债券违约预测中基于元学习和改进的 Catboost算法的方法。首先对原始数据采用K近邻进行缺失值的填补,为了消除单位和量纲的影响,进行标准化处理,然后采用基于元学习框架的显式梯度学习数据增强(EGLA)来处理不平衡的问题,然后使用相关分析和随机森林相结合的方式进行特征筛选工程,最终选取重要性排名前20的特征作为Catboost模型的输入,并用非线性加速改进后的GHMNA Loss作为Catboost算法的损失函数,得到了改进的 Catboost模型进行债券违约预测。
为了实现上述目的,本发明提供了如下技术方案:
本发明提供一种基于元学习和改进的Catboost算法的债券违约预测方法,该方法包括如下步骤:
步骤一:数据预处理
(1.1)将债券违约相关数据集作为输入,首先进行缺失值的处理,采取K近邻算法进行缺失值的填补;
(1.2)对进行过缺失值处理后的数据进行最大最小归一化的标准化处理。
步骤二:特征工程
(2.1)对进行预处理后的数据集采用基于元学习的显式梯度数据增强(EGLA)进行不平衡数据的处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江财经大学,未经浙江财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210502069.9/2.html,转载请声明来源钻瓜专利网。