[发明专利]一种基于SVM聚类的车险特征的有效性分析方法在审
申请号: | 202210486227.6 | 申请日: | 2022-05-06 |
公开(公告)号: | CN114971211A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 吴志辉 | 申请(专利权)人: | 上海评驾科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/08;G06K9/62;G01S19/14 |
代理公司: | 北京国坤专利代理事务所(普通合伙) 11491 | 代理人: | 张国栋 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 svm 车险 特征 有效性 分析 方法 | ||
本发明公开了一种基于SVM聚类的车险特征的有效性分析方法,包括车联网GPS卫星定位数据的清洗,补限速信息,行程化,补天气和poi信息,计算风险因子,最后以赔付率预测为例进行风险因子的有效性分析。本发明的有益效果是:可以大幅度减少建模所需因子的个数,缓解因子间的多重共线性,提高模型的泛化能力。
技术领域
本发明涉及一种车辆保险特征因子的分析方法,具体为一种基于SVM聚类方法的车险特征因子的有效性分析方法,属于机器学习和特征工程技术领域。
背景技术
SVM是一种基于SRM原则的学习算法,最初用它来处理模式识别问题。
1964年出现的广义肖像算法是SVM寻找超平面分类思想的雏形,1992年SVM被推广到非线性可分的情形,1993年被应用到非完全可分的情形,1995年被用来估计实值函数,1996年推广到线性算子方程领域。支持向量机首先把原始数据空间映射(升维)到一个维数更高的特征空间,进而实现在高维特征空间中寻找最优的分类超平面完成分类,这种非线性变换是通过一个内积函数实现的,SVM通过最大间隔因子来控制训练过程,进而实现分类平面只选择最大分类间隔的分类超平面。当样本线性不可分时,通过加入松弛因子来处理异常值。这个过程可以转化为一个凸二次优化问题,进而构造拉格朗日函数,然后通过KKT条件求出原问题的对偶问题,此时问题也就转化成了最小序列优化算法(SMO)可以求得全局最优解的问题。
支持向量机聚类算法(Support Vector Clustering,SVC)是基于核的聚类算法的一种,其实现的过程如下:(1)构建支持向量的函数表达式。原数据通过核函数映射到高维的特征空间,在高维特征空间中搜索最小的封闭的能包围同类所有数据的最小超球体(设其半径为R)。该球体可以分单元地把高维数据映射回原来的数据空间时,此时每个单元就是一个独立的类别,球体的轮廓映射成成原数据空间中各类别边界的轮廓,处在轮廓上的样本点称作支持向量,它们一起构成支持向量的函数表达式。(2)类别标定。在高维特征空间中通过对任意实例进行采样,如果两个采样点在经过核方法映射后的高维空间中距离超球体的中心距离大于球体的半径,则这两个实例点不在同一个类别,反之,该对样本点属于同一类别。
例如:对车险业务来说,每个用户的风险因子太多不利于后续的模型分析,较为有效的方法是选取较为显著的几个因子进行聚类分析,然而现有技术中并未有基于SVM聚类分析法,基于此,本申请提出一种基于SVM聚类方法的车险特征因子的有效性分析方法。
发明内容
本发明的目的就是为了解决这一问题而提供的一种基于SVM聚类方法的车险特征因子的有效性分析方法。
本发明通过以下技术方案来实现上述目的:一种基于SVM聚类方法的车险特征因子的有效性分析方法,其特征在于,包括以下步骤:
步骤一、获取车联网数据,通过车联网采集装设备提供的卫星定位数据获取车联网数据;
步骤二、对数据进行预处理并补全道路限速信息;
步骤三、数据的行程化处理,将离散的GPS点按照特定规则合并成多段行程;
步骤四、补天气以及补poi数据;
步骤五、提取计算各个风险因子的值;
步骤六、选取风险因子进行聚类分析;
步骤七、根据聚类后的特征进行建模分析。
作为本发明再进一步的方案:所述步骤一中,车联网数据采集装备包括前装设备T-Box、后采集装备OBD、后视镜、行车记录仪等,采集的数据包括卫星定位经度、卫星定位纬度、卫星定位时间、系统设备时间、卫星精度等。其中,常见的数据点采集频率为1秒、15秒或30秒。
作为本发明再进一步的方案:所述步骤二中,数据的预处理和补全道路信息包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海评驾科技有限公司,未经上海评驾科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210486227.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理