[发明专利]社会风险指数分类模型构建方法、系统、设备和存储介质在审
| 申请号: | 202210012522.8 | 申请日: | 2022-01-07 |
| 公开(公告)号: | CN114372698A | 公开(公告)日: | 2022-04-19 |
| 发明(设计)人: | 朱毅;陈胜鹏;雷振;李飞;陈雪 | 申请(专利权)人: | 武大吉奥信息技术有限公司 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F30/27;G06K9/62;G06N20/20;G06Q50/26 |
| 代理公司: | 深圳尚业知识产权代理事务所(普通合伙) 44503 | 代理人: | 王利彬 |
| 地址: | 430000 湖北省武汉*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 社会 风险 指数 分类 模型 构建 方法 系统 设备 存储 介质 | ||
1.一种社会风险指数分类模型构建方法,包括:
获取训练集和测试集数据,并对获取的所有数据进行清洗及特征变换处理;
对处理后的训练集和测试集数据按比例划分类别状态,并以划分的类别状态为标签进行状态分类;
将状态分类的训练集数据代入不同分类预测模型中进行训练,并将状态分类测试集数据代入对应的训练后模型中进行预测,得到预测结果;
将所述预测结果与测试集数据的实际结果对比,分析使用量化的训练集数据所训练的结果差异性;
按状态分类对训练的不同模型进行排名,得到不同阶段、不同算法对数据拟合的偏好程度;
基于准确率和Pearson相关系数的不同结果衡量指标,得到按准确率进行排名和按Pearson相关系数进行排名的方法,聚合每个阶段最优方法,生成一个新的排名,构建形成一个社会风险指数分类模型。
2.如权利要求1所述的社会风险指数分类模型构建方法,其特征在于:所述对获取的所有数据进行清洗及特征变换处理,包括以下步骤:
对采集的所有数据进行数据清洗,对缺失值数据进行补充或删除;
对清洗后数据进行特征变换,对清洗后所有数据进行归一化和标准化处理,并针对数据集中的连续型数值进行数值化处理转换为离散型数值,对不同类别的数据贴上标签。
3.如权利要求2所述的社会风险指数分类模型构建方法,其特征在于:数据进行特征变换处理之后,还包括特征关联性分析,数据的特征关联性分析使用的是Pearson相关系数来衡量数据之间两个特征组合的线性关系,通过计算相关性矩阵,选择关联性强的特征,剔除不相关或冗余的特征,减少特征个数。
4.如权利要求3所述的社会风险指数分类模型构建方法,其特征在于:数据进行特征关联性分析之后,还包括数据集划分,根据数据采集的来源不同进行分类,以采集的数据中的一组数据作为训练集数据,以采集的数据中的另一组作为测试集数据,对训练集和测试集数据按比例划分类别状态时,按照普通级、关注级、严管级以及禁止级4个类别状态进行划分。
5.如权利要求4所述的社会风险指数分类模型构建方法,其特征在于:将状态分类的训练集数据代入不同分类预测模型中进行训练时,不同分类预测模型包括CatBoost模型、MLP多层感知器模型、KNN分类模型、GaussianNB模型、BernoulliNB模型、朴素贝叶斯模型、决策树DT模型、支持向量机SVM模型、随机森林RF模型、Adaboost模型、LogisticRegreesion模型、GBDT梯度提升决策树模型。
6.如权利要求5所述的社会风险指数分类模型构建方法,其特征在于:所述结果衡量指标中Pearson相关系数表征相对排名的精度,所述Pearson相关系数用于测量数据的两个特征组合之间的线性相关程度,所述Pearson相关系数的范围是-1至+1,其中,1表示两个特征之间的总正线性相关,0表示无线相关,-1代表两个特征之间的总负线性相关。
7.一种社会风险指数分类模型构建系统,其特征在于:所述社会风险指数分类模型构建系统采用权利要求1-6中任意一项所述社会风险指数分类模型的构建方法来构建社会风险指数模型,实现社会治理风险评级;所述社会风险指数分类模型构建系统包括:
数据集获取模块,用于采集数据,并对获取的所有数据进行清洗、特征变换处理以及特征关联性分析后划分训练集数据和测试集数据;
状态分类模块,用于将训练集和测试集数据按比例划分类别状态,并以划分的类别状态为标签进行状态分类;
分类排名模块,用于将状态分类的训练集数据代入不同分类预测模型中进行训练,并将状态分类测试集数据代入对应的训练后模型中进行预测,得到预测结果,将所述预测结果与测试集数据的实际结果对比,分析使用量化的训练集数据所训练的结果差异性,按状态分类对训练的不同模型进行排名,得到不同阶段、不同算法对数据拟合的偏好程度;
集成模块,用于根据不同结果衡量指标,得到按不同结果衡量指标进行排名的方法,聚合每个阶段最优方法,生成一个新的排名,构建形成一个社会风险指数分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武大吉奥信息技术有限公司,未经武大吉奥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210012522.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





