[发明专利]基于新型特征优化算法的车险诈骗识别方法、装置及设备在审
申请号: | 202310370147.9 | 申请日: | 2023-04-07 |
公开(公告)号: | CN116579861A | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 何晓霞;颜巍;文艺;张铎;易显龙 | 申请(专利权)人: | 中国人民财产保险股份有限公司 |
主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06F18/214;G06F18/27;G06N20/20 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王治东 |
地址: | 100022 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 新型 特征 优化 算法 车险 诈骗 识别 方法 装置 设备 | ||
1.一种基于新型特征优化算法的车险诈骗识别方法,其特征在于,包括:
获取车险理赔欺诈的待测数据集;
基于分类模型对所述待测数据集进行分类处理,得到分类结果;
其中,所述分类模型通过训练集完成训练,所述训练集为通过综合采样算法进行平衡处理以及通过特征选择算法EFS_BR优化后的数据集;所述分类结果用于反映是否存在车险理赔欺诈行为。
2.根据权利要求1所述的方法,其特征在于,在通过特征选择算法EFS_BR优化训练集的过程中,所述方法还包括:
获取平衡处理后的训练集数据矩阵X,所述训练集数据矩阵X包括n个样本和d个特征;
通过嵌入式特征选择算法从所述训练集数据矩阵X中的所有特征中选择s个特征,根据选择的s个特征确定被选择的特征数据矩阵FS;
根据未被选择的d-s个特征确定未被选择的特征数据矩阵UFS。
3.根据权利要求2所述的方法,其特征在于,在通过特征选择算法EFS_BR优化训练集的过程中,所述方法还包括:
通过过滤式特征选择算法确定所述被选择的特征数据矩阵FS和未被选择的特征数据矩阵UFS中每个特征和标签的关联度;
根据所述关联度从所述被选择的s个特征中筛选出关联度较高的k个特征,并生成关于所述k个特征的第一矩阵;
根据所述关联度从所述未被选择的d-s个特征中筛选出关联度较高的t个特征,并生成关于所述t个特征的第二矩阵;
将所述第一矩阵和所述第二矩阵进行合并,得到合并矩阵W,以剔除FS中关联度未达到关联度阈值的特征;
根据所述合并矩阵W训练基模型,所述基模型采用逻辑回归分类算法;
计算所述基模型的分类损失值,根据所述分类损失值确定最终输出的合并矩阵W*,作为优化后的训练集。
4.根据权利要求2所述的方法,其特征在于,在通过特征选择算法EFS_BR优化训练集的过程中,所述方法还包括:
在确定被选择的特征数据矩阵FS和未被选择的特征数据矩阵UFS后,进入外层循环;其中,根据被选择的特征个数s确定外层循环次数为s;
从被选择的特征数据矩阵FS中筛选出前k个关联度较高的特征生成第一矩阵,所述k与所述外层循环的当前循环次序相等;
进入内层循环,根据所述第一矩阵得到合并矩阵W,根据所述合并矩阵W训练基模型,所述基模型采用逻辑回归分类算法;
根据测试集及其分类标签数据计算得到所述基模型的分类损失值,确定当前循环内所述分类损失值最小时对应的合并矩阵;其中,所述测试集中的特征类别与合并矩阵的特征类别相同;
内层循环结束后继续外层循环,外层循环结束后返回分类损失值最小时对应的合并矩阵W*,根据所述合并矩阵W*得到优化后的训练集。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一矩阵得到合并矩阵,具体包括:
从所述未被选择的特征数据矩阵中筛选出前t个关联度较高的特征生成第二矩阵,所述t与所述内层循环的当前循环次序相等;
将第一矩阵和所述第二矩阵进行合并,得到合并矩阵。
6.根据权利要求4所述的方法,其特征在于,所述确定当前循环内所述分类损失值最小时对应的合并矩阵,具体包括:
将所述基模型的分类损失值和预设的初始分类损失值进行比较;
若计算得到的分类损失值小于所述初始分类损失值,则将计算得到的分类损失值作为初始分类损失值,并将所述合并矩阵作为分类损失值最小时对应的特征数据矩阵。
7.根据权利要求1所述的方法,其特征在于,通过综合采样算法对训练集数据进行平衡处理,包括:
对于训练集中的样本,通过SMOTE算法从样本少的类别中随机抽样,再将抽样后处理得到的新样本添加到训练集中,得到初步平衡的训练集;
通过ENN算法剔除初步平衡的训练集中的重叠样本,得到最终平衡后的训练集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民财产保险股份有限公司,未经中国人民财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310370147.9/1.html,转载请声明来源钻瓜专利网。