[发明专利]一种保险投保单的风险评估方法以及系统在审
| 申请号: | 202111508480.9 | 申请日: | 2021-12-10 |
| 公开(公告)号: | CN114170031A | 公开(公告)日: | 2022-03-11 |
| 发明(设计)人: | 吕鹏 | 申请(专利权)人: | 金科览智科技(北京)有限公司 |
| 主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06F16/22;G06F16/25;G06F16/81;G06F40/216;G06F40/289;G06F40/30;G06K9/62;G06N3/04 |
| 代理公司: | 北京冬瓜知识产权代理事务所(普通合伙) 11854 | 代理人: | 李佳 |
| 地址: | 100037 北京市西*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 保险 投保 风险 评估 方法 以及 系统 | ||
1.一种保险投保单的风险评估方法,其特征在于,包括如下步骤:
对内外部数据进行标准化处理,标准化处理之后的数据根据不同类型进行分别处理,半结构化的数据采用深度学习NLP方向中的TextCNN模型进行处理,结构化的数据采用沟通SQL进行数据库表关联获取,形成基础特征;
然后结合半结构化数据、结构化数据获取到的所述基础特征,进行深度特征加工;
进行深度加工后的数据送入LightGBM的主模型进行训练,主模型为以分类或回归树为基础分类器的提升树模型GBDT变种。
2.根据权利要求1所述的保险投保单的风险评估方法,其特征在于,所述标准化处理的方法包括:对于数据缺省、码值不统一、配置表统一整合的内容进行ETL处理。
3.根据权利要求1所述的保险投保单的风险评估方法,其特征在于,半结构化数据的处理方法包括:将话术做为输入,历史核保结论为输出,通过向量化的输入序列求出与其输出目标函数最小化的概率,以实现经过TextCNN模型的输出为一段描述性文本在某个保单产品场景下的风险概率。
4.根据权利要求1所述的保险投保单的风险评估方法,其特征在于,所述深度特征加工的方法包括:
基于数理的加、减、乘、除、指数变换、woe计算、类型性数据转换以及KS分箱的方法。
5.根据权利要求1所述的保险投保单的风险评估方法,其特征在于,所述主模型的计算方法包括如下步骤:
假设K个CART,其中第k个CART记为Tk(x),前k个CART的预测值记为
将前k个CART的预测值表示为一个递归形式:
fk(x)=fk-1(x)+Tk(x);
在训练第k个CART的时候,最小化成以下的目标函数:
目标函数对fk-1的梯度是:沿着这个方向走得到一个新的函数,其相应的损失函数值更小;
采用梯度下降法优化模型参数的形式:
通过上述算式得到:
第k个CART的拟合对象为目标函数的负梯度,假定学习率为1;
采用残差平方和作为目标函数:
因此有:
以此类推,直到每一个基础模型都训练完毕,假设最后的提升树中有K个CART,那么使用它进行预测的规则就是:
6.根据权利要求1-5任一项所述的保险投保单的风险评估方法,其特征在于,进行所述主模型训练后的结果分为投保单风险的概率以及风险概率的可解释性要素两部分进行输出。
7.根据权利要求6所述的保险投保单的风险评估方法,其特征在于,所述可解释性要素的方法包括:
假设第i个样本为xi,第i个样本的第j个特征为xi_j,模型对该样本的预测值为yi,整个模型的基线为y_base,那么输出值服从以下等式:
yi=ybase+f(xi1)+f(xi2)+...+f(xik);
其中f(x_ij)为x_ij的贡献值,f(xi,1)就是第i个样本中第1个特征对最终预测值yi的贡献值,当f(xi,1)0,说明该特征提升了预测值,起正向作用;反之,说明该特征使得预测值降低,有反作用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金科览智科技(北京)有限公司,未经金科览智科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111508480.9/1.html,转载请声明来源钻瓜专利网。





