[发明专利]基于机器学习的车险数据处理方法、车险欺诈识别方法及装置在审
申请号: | 201611130098.8 | 申请日: | 2016-12-09 |
公开(公告)号: | CN106600423A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 宋骁程;谭浩宇;肖文晗 | 申请(专利权)人: | 云数信息科技(深圳)有限公司 |
主分类号: | G06Q40/08 | 分类号: | G06Q40/08 |
代理公司: | 广州三环专利代理有限公司44202 | 代理人: | 麦小婵,郝传鑫 |
地址: | 518000 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 车险 数据处理 方法 欺诈 识别 装置 | ||
1.一种基于机器学习的车险数据处理方法,其特征在于,包括:
根据多项车险案例的原始数据,获得建模数据列表;其中,所述建模数据列表包括多项车险案例的建模数据,每一项建模数据包括所述车险案例的N个特征变量以及欺诈认定结果;
以所述建模数据列表为样本,应用第一类分类器建立M1个不同的子模型;
以所述建模数据列表为样本,应用第二类分类器建立M2个不同的子模型;
融合所述M1个子模型和所述M2个子模型,建立识别车险欺诈的数据模型;其中,按照所述识别车险欺诈的数据模型,可将待识别的车险案例的原始数据转化为欺诈概率,以判定所述待识别的车险案例是否为欺诈案例。
2.如权利要求1所述的车险数据处理方法,其特征在于,所述第一类分类器为随机森林分类器,所述第二类分类器为迭代决策树分类器;
所述融合所述M1个子模型和所述M2个子模型,建立所述识别车险欺诈的数据模型,具体包括:
以所述建模数据列表为样本,应用贝叶斯分类器建立M3个不同的子模型;
构建以所述M1个子模型、M2个子模型和M3个子模型的投票结果作为输出结果的数据模型,作为所述识别车险欺诈的数据模型;其中,所述投票结果为判定车险案例为欺诈案例的票数占总票数的比例。
3.如权利要求1或2所述的车险数据处理方法,其特征在于,所述以所述建模数据列表为样本,应用第一类分类器建立M1个不同的子模型,包括:
以所述建模数据列表为样本,将所述第一类分类器中的预先指定的一个参数配置为f(x);
以L种不同的数值组合配置所述第一类分类器中的其余参数;
根据其余参数的L种不同的数值组合,应用第一分类器分别建立L个候选子模型;
以交叉校验法分别评估所述L个候选子模型的预测准确率;
从L个候选子模型中选取预测准确率最高的候选子模型,作为第x个子模型,其中,0<x≤M1。
4.如权利要求1或2所述的车险数据处理方法,其特征在于,所述根据多项车险案例的原始数据,获得建模数据列表,具体包括:
对多项车险案例中的每一项车险案例的原始数据执行预处理,生成所述每一项车险案例的N个特征变量;其中,所述预处理包括:剔除异常值、填充缺省值和转换类别型变量;
提取所述每一项车险案例的建模数据,获得初始的建模数据列表;
对欺诈案例的建模数据进行过采样,更新所述建模数据列表。
5.一种车险欺诈识别方法,其特征在于,包括:
以待识别的车险案例的原始数据为输入数据,运行如权利要求1至4任一项所述的识别车险欺诈的数据模型;
将所述识别车险欺诈的数据模型的输出结果作为所述待识别的车险案例的欺诈概率;
根据所述欺诈概率,判定所述待识别的车险案例是否欺诈案例。
6.一种车险数据处理装置,其特征在于,包括:
原始数据处理模块,用于根据多项车险案例的原始数据,获得建模数据列表;其中,所述建模数据列表包括多项车险案例的建模数据,每一项建模数据包括所述车险案例的N个特征变量以及欺诈认定结果;
第一子模型建立模块,用于以所述建模数据列表为样本,应用第一类分类器建立M1个不同的子模型;
第二子模型建立模块,用于以所述建模数据列表为样本,应用第二类分类器建立M2个不同的子模型;
模型融合模块,用于融合所述M1个子模型和所述M2个子模型,建立识别车险欺诈的数据模型;其中,按照所述识别车险欺诈的数据模型,可将待识别的车险案例的原始数据转化为欺诈概率,以判定所述待识别的车险案例是否为欺诈案例。
7.如权利要求6所述的车险数据处理装置,其特征在于,所述第一类分类器为随机森林分类器,所述第二类分类器为迭代决策树分类器;
所述模型融合模块包括:
贝叶斯模型建立单元,用于以所述建模数据列表为样本,应用贝叶斯分类器建立M3个不同的子模型;
投票单元,用于构建以所述M1个子模型、M2个子模型和M3个子模型的投票结果作为输出结果的数据模型,作为所述识别车险欺诈的数据模型;其中,所述投票结果为判定车险案例为欺诈的票数占总票数的比例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云数信息科技(深圳)有限公司,未经云数信息科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611130098.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车险智能定损方法和系统
- 下一篇:数据核实的提示方法及装置