[发明专利]一种分布式模型聚合计算系统及方法有效
申请号: | 202110749577.2 | 申请日: | 2021-07-02 |
公开(公告)号: | CN113591925B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 王萍;周成;李辉;王瑞成;党李鹏 | 申请(专利权)人: | 四川新网银行股份有限公司 |
主分类号: | G06F18/2321 | 分类号: | G06F18/2321;G06F18/25;G06Q10/0635 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 蒋秀清 |
地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 模型 聚合 计算 系统 方法 | ||
本发明属于数据处理技术领域,尤其涉及一种分布式模型聚合计算模块及方法。业务模块、分布式模型聚合计算模块、决策模块三个模块组成。首先,业务模块发起调用请求。其次,分布式模型聚合计算模块对调用的模型进行计算,对于数据源相同的模型集,在分布式的聚合计算框架下先聚合模型数据源,再进行分布式计算聚合模型结果;对于数据源不同的模型集,分别进行分布式的计算,并行计算模型出参信息。最后,决策模块根据模型聚合参数和并行计算的模型参数综合决策输出综合决策结果。通过分布式的模型聚合计算系统,最大化的减少了系统交互次数,提升了模型运算的效率。
技术领域
本发明属于数据处理技术领域,尤其涉及一种分布式模型聚合计算系统及方法。
背景技术
随着IT技术的不断发展,大数据引起了广泛的关注。在竞争日益激烈的技术市场中,从高科技初创企业到全球跨国企业都将人工智能视为关键竞争优势。目前机器学习的应用范围已经非常广泛,比如智慧医疗、智能推荐、无人驾驶等。现如今,机器学习已经成为认知技术中最炙手可热的研究领域之一,越来越多的领域依赖于机器学习算法进行科学决策。
在金融领域,越来越多的金融服务往线上转移,个人金融的数字化转型将随着金融和科技不断融合,呈现在“线上化”、“开放化”、“直营化”、“智慧化”四大趋势。随着大数据、人工智能技术越来越多的运用于风险管理,基于机器学习的智能风控体系已经成为线上金融风控的主流。
在线上风控中,金融机构聚集来自于人行征信系统、政府、运营商、电商等多源数据信息构建各类风控模型,如:资金紧张模型、身份伪冒模型、电信诈骗模型、首逾高风险模型、逾期模型等。关于模型计算,当前行业的一般方案是模型依次计算的方案,一个模型运算包括模型入参、模型计算、模型出参三个部分;这种以模型为原子化的方案存在交互次数多,空间浪费,运算时间长等问题。
发明内容
本发明提供了一种分布式模型聚合计算系统及方法,拟解决背景技术提到的以模型为原子化的方案存在交互次数多、空间浪费、运算时间长的问题。
一种分布式模型聚合计算系统,包括业务模块、分布式模型聚合计算模块;
所述业务模块用于发起模型调用请求,调用请求的参数包括id和modeName;
分布式模型聚合计算模块用于接收来自业务模块的调用请求,根据调用请求的参数modeName调用相关参数,并得到各个模型的模型参数;
所述分布式模型聚合计算模块包括数据源聚合子模块、模型分布式计算子模块、模型参数计算子模块;
所述数据源聚合子模型根据模型入参信息的相似性进行聚类;
所述模型分布式计算子模块对进行聚类的模型聚合计算,其余的模型进行分布式并行计算;
所述模型参数子模块用于汇总分布式计算子模块的模型计算结果,输出模型参数信息模型分和模型的重要特征变量集。
优选的,所述业务模块的调用方式采用HTTP POST请求,参数格式采用JSON。
优选的,所述id为字符串格式,长度设置为32位,为MD5加密的用户身份证信息;所述modeName为字符串数组格式,长度设置为500位,表示请求的模型列表。
进一步的,还包括决策模块,所述决策模块基于分布式模型聚合计算模块的计算结果信息,进行综合决策,输出决策结果;决策结果包括综合决策结果、综合风险等级、综合决策风险分、命中策略提示信息。
优选的,所述综合决策风险分的运算包括对模型结果集中模型信息进行融合,计算综合决策风险分,其公式如下所示:
finalRiskScore表示综合决策风险分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110749577.2/2.html,转载请声明来源钻瓜专利网。