[发明专利]一种运营商与互联网行业信用评估方法与系统在审
申请号: | 202310729885.8 | 申请日: | 2023-06-20 |
公开(公告)号: | CN116630030A | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 张海;王伟 | 申请(专利权)人: | 浪潮通信信息系统有限公司 |
主分类号: | G06Q40/03 | 分类号: | G06Q40/03;G06Q10/0639;G06F18/214;G06F18/27 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜鹏 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 运营商 互联网 行业 信用 评估 方法 系统 | ||
本发明涉及大数据分析技术领域,具体为一种运营商与互联网行业信用评估方法与系统,包括以下步骤:在本地搭建的miniconda包上传至大数据集群客户端,为建模提供相应的工具库支撑;取样本数据;数据预处理;在客户端使用处理过的样本数据训练逻辑回归模型并生成评分卡;模型部署;有益效果为:本发明提出的运营商与互联网行业信用评估方法与系统,提供用户信用评分模型指标体系管理,后台提供指标的维护、指标更新规则、指标生命周期、指标权重调整等功能,实现用户信用的全程跟踪管理。指标管理可根据不同客户需求,实现基于用户信用指标,结合行业客户特征,实现多指标的选取、多维度的选取、指标权重调整、维度权重调整等。
技术领域
本发明涉及大数据分析技术领域,具体为一种运营商与互联网行业信用评估方法与系统。
背景技术
在运营商内部业务运用中,涉及消费品信贷或新业务(如:零首付购机、延迟停机、授信话费、新业务试用、商家合作活动优先等)应用时,需要评估用户的信用风险。
现有技术中,互联网的“虚拟性”也使得信用风险信息的不对称问题日益凸出,阻碍互联网行业的良性发展。互联网金融、网络购物平台、互联网旅游公司推出越来越多的信用消费产品,产生大量的用户信用评估需求;logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,logistic回归已广泛应用在大数据分析领域。
但是,由于Logistic回归对变量有特殊的要求,当分类自变量多于两个类别时,就需要建立一组虚拟变量代表类型的归属性质。最终选取的特征变量中有个是属性变量,其中有个不是二分类变量还不能直接用于建模。
发明内容
本发明的目的在于提供一种运营商与互联网行业信用评估方法与系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种运营商与互联网行业信用评估方法,所述方法包括以下步骤:
在本地搭建的miniconda包上传至大数据集群客户端,为建模提供相应的工具库支撑;
取样本数据;
数据预处理;
在客户端使用处理过的样本数据训练逻辑回归模型并生成评分卡;
模型部署。
优选的,取样本数据具体操作如下:
在大数据平台客户端,根据评估需要取正负样本进行数据分析,以根据运营商数据构建的通用型评分卡为例,在大数据集群客户端先依据运营商黑名单取出5w条用户数据做负样本,再取等量正常用户数据做正样本,构建训练和测试数据集。
优选的,数据预处理具体操作如下:
在客户端根据客户的样本数据质量,以IV值和相关性系数等指标分析各个指标数据的可用性,剔除有效信息较低的数据指标,并保留指定的代表性较强的数据指标,对样本数据进行异常值剔除、缺失值填充,归一化特征工程。
优选的,模型部署的具体操作如下:
在客户端将评分卡数据写入hive数据表,通过dataos平台读取全量用户的数据,并依据评分卡生成全量用户的信用评分,依据前台需求将评分结果写入redis或者mysql。
一种运营商与互联网行业信用评估方法系统,所述系统由搭建模块、采样模块、数据处理模块、训练模块以及部署模块构成;
搭建模块,在本地搭建的miniconda包上传至大数据集群客户端,为建模提供相应的工具库支撑;
采样模块,用于取样本数据;
数据处理模块,用于数据预处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮通信信息系统有限公司,未经浪潮通信信息系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310729885.8/2.html,转载请声明来源钻瓜专利网。