[发明专利]一种生成模型的方法、装置、信息处理的方法及装置有效
申请号: | 201910943663.X | 申请日: | 2019-09-30 |
公开(公告)号: | CN110796269B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 李犇;张杰 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06N20/10 | 分类号: | G06N20/10 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王康;栗若木 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生成 模型 方法 装置 信息处理 | ||
一种生成模型的方法、装置、信息处理的方法及装置,包括:根据异构信息网络的样本客户的元路径节点序列,生成两个或两个以上图嵌入向量;输入获得的各图嵌入向量到神经网络模型,将神经网络模型与样本客户的客户特征向量和训练标签进行联合构建,获得用于风险评估的评分模型;其中,各所述图嵌入向量由:根据用户身份节点和除用户身份节点以外的一种节点生成的元路径节点序列的集合生成;所述训练标签根据所述样本客户的客户业务状态获得。本发明实施例基于元路径节点序列生成的多个图嵌入向量构建评分模型,提升了评分模型的可解释性。
技术领域
本文涉及但不限于技术,尤指一种生成模型的方法、装置、信息处理的方法及装置。
背景技术
传统的金融机构在进行的信用风险量化时,使用的建模方式是构建评分卡模型,构建评分卡模型包括:通过特征工程筛选出刻画客户风险的特征变量;通过筛选出的特征变量训练逻辑回归模型;转换训练获得的逻辑回归模型为评分卡模型。这种方法具有较高的可解释性,有利于风控人员通过调整风控政策来调控风险。
随着大数据技术的发展,一些金融机构开始将关系网络技术应用到用于信用风险量化的评分模型中,关系网络首先在同构网络的评分模型中被引入,包括:根据客户的关联关系构建关系网络;利用图嵌入算法(包括但不限于深度游走(DeepWalk)和Node2Vec(是一种综合考虑深度优先搜索(DFS)邻域和宽度优先搜索(BFS)邻域的图嵌入方法))将关系网络嵌入到低维向量空间,获取每个客户的图嵌入向量;根据获取的各客户的图嵌入向量及客户的其他特征变量构建评分模型;通过图嵌入方法将客户的关系网络转变为低维的向量应用到评分模型中,提高了信用风险模型的效果。对于信息更丰富的异构信息网络(以下简称为异构网络),由于网络中存在着不同类型的节点和边,且节点和边包含着许多属性信息,在无法将节点和边的类型及属性信息融合到图嵌入时,生成的图嵌入向量将无法有效表示客户异构网络的信息,导致构建的评分模型缺乏一定的可解释性,这是一个需要解决的问题。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供一种生成模型的方法、装置、计算机存储介质及终端,能够提升评分模型的可解释性。
本发明实施例提供了一种生成模型的方法,包括:
根据异构信息网络的样本客户的元路径节点序列,生成两个或两个以上图嵌入向量;
输入获得的各图嵌入向量到神经网络模型,将神经网络模型与样本客户的客户特征向量和训练标签进行联合构建,获得用于风险评估的评分模型;
其中,各所述图嵌入向量由:根据用户身份节点和除用户身份节点以外的一种节点生成的元路径节点序列的集合生成;所述训练标签根据所述样本客户的客户业务状态获得。
在一种示例性实施例中,所述输入获得的各图嵌入向量到神经网络模型,包括:
将获得的每一个所述图嵌入向量分别通过独立的神经元输入所述神经网络模型。
在一种示例性实施例中,所述生成两个或两个以上图嵌入向量之前,所述方法还包括:
获取所述样本客户的基本信息;
根据获取的所述样本客户的基本信息,确定用于生成元路径节点序列的纲要Schema信息;
其中,所述纲要信息包括:用户身份节点及除用户身份节点以外的用于生成所述元路径节点序列的其他节点。
另一方面,本发明实施例还提供一种信息处理的方法,包括:
根据异构信息网络的样本客户的元路径节点序列,生成两个或两个以上图嵌入向量;
输入获得的各图嵌入向量到神经网络模型,将神经网络模型与样本客户的客户特征向量和训练标签进行联合构建,获得评分模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910943663.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:确定业务处理模型超参数的方法和装置
- 下一篇:一种机器学习模型选择方法