[发明专利]基于社会网络分析技术的数据挖掘的一种方法在审
申请号: | 202110704883.4 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113408207A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 祖玉宁 | 申请(专利权)人: | 上海硕恩网络科技股份有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06Q40/02;G06F16/2458;G06F16/28;G06F16/35;G06F40/30;G06F16/951;G06F9/50 |
代理公司: | 北京贵都专利代理事务所(普通合伙) 11649 | 代理人: | 李新锋 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 社会 网络分析 技术 数据 挖掘 一种 方法 | ||
本发明涉及数据挖掘技术领域,更具体的说是涉及基于社会网络分析技术的数据挖掘的一种方法,包括征信风控建模、特征变量库、仿真数据库和场景变量数据挖掘四个模块。本发明支持多业务场景–发卡、调额、催收等建模(风控)有效信息覆盖率达95‑99%;特征变量加工代码正确率高达99.99%口有效保障模型的可靠性,风险识别率高获益机会识别率高大幅提升行方数据分析能力;大幅度减轻信息科技部的临时开发任务压力对业务知识形成系统化框架;实时更新新增大额分期录入更多网贷信息新增共同借款标志;业务知识全覆盖,全库特征变量数已达700,000+灵活有效应对以上行业痛点,全方位支撑各种业务场景需求兼容性好,可融合多方数据源。
技术领域
本发明涉及数据挖掘技术领域,更具体的说是涉及基于社会网络分析技术的数据挖掘的一种方法。
背景技术
随着社会信息化的不断发展,信息技术应用领域的不断拓展,各个应用领域包括经济、医疗、建筑、环境等均积累了越来越多的数据。自上世纪八十年代开始,世界各地的数据总量飞速增长,甚至几个月就会增长一倍,然而如何有效的利用、分析这些数据信息,并从中获取其隐藏的有用信息,则成了一个巨大的挑战。在这些海量的数据中,有一部分数据是按时间顺序有序排列的,这类数据便称之为时间序列(TimeSeries)。各个应用领域中均存在时间序列,通过深入研究这些时间序列,发现序列背后所隐藏的潜在规律以及有价值的信息具有重大的社会意义和经济价值。
近年来,随着数据量的增加,一些数据分析方法无法有效提取出更多有价值的数据信息,因此一种新的数据分析方法——数据挖掘(DataMining)技术便产生了。数据挖掘技术不仅能分析已有的数据,还可从原有数据中预测未来未知的信息,譬如,通过数据挖掘可以预测到下月某商场的销售量等。何为数据挖掘?数据挖掘可以以许多不同的形式被定义,简单来说,数据挖掘就是从海量的数据信息中提取出有价值的信息,原有的数据大部分是有模糊噪声的数据,但在这些数据中又存在着很多潜在价值。挖掘的过程是通过利用各个领域的技术知识对海量数据进行处理分析,挖掘出可以有益于人们进行更高层次的分析决策的内容。
目前,虽然国内外对数据挖掘的研究已取得不少的成果,但对各个应用领域的时间序列的挖掘却没有通用性,譬如对金融领域的数据挖掘的方法在医疗领域应用时所得到的性能效果不是很好。现在大多数的方法可能只是在某一个方面表现出较为良好的性能,而不能在其他各个方面综合起来有一个很好的性能。显然,以往对时间序列的研究还是存在着一些不足的,对于不同领域的时间序列挖掘问题,传统的挖掘方法己不适用,如何寻求一些新的数据挖掘是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明目的在于提供一种基于社会网络分析技术的数据挖掘的一种方法,使其能有效地处理海量数据,提高数据挖掘的运算速度和精度,能有效提取所需的探索兴趣特征数据,具有覆盖面广、灵活性强、风险识别率高的特点。
为实现上述目的,本发明提供如下技术方案:
基于社会网络分析技术的数据挖掘的一种方法,其特征在于,包括:征信风控建模、特征变量库、仿真数据库以及场景变量数据挖掘四个模块;
所述征信风控建模的具体操作步骤如下:
S1.准备数据,收集存量数据样本;
S2.对数据样本进行预处理,根据数据样本的属性建立特征变量宽表数据集;
S3.对所述数据集进行划分,将数据集划分成训练集、测试集和验证集;
S4.建立训练模型;
S5.使用训模型训练,并调整损失函数和优化器;
S6.评分卡生成,使用S2中所述测试机评估训练模型的测试准确度;
S7.公布,并在业务场景中应用;
S8.应用的数据沉淀并反馈至S1处进入收集的样本中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海硕恩网络科技股份有限公司,未经上海硕恩网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110704883.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种商用车同步器寿命的实时监测方法及监测装置
- 下一篇:功率半导体器件