[发明专利]异常账户的分类方法、装置、电子设备及存储介质在审
申请号: | 202310252743.7 | 申请日: | 2023-03-07 |
公开(公告)号: | CN116304943A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 陈李龙;徐林嘉;张宏韬;卢健 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F18/2433 | 分类号: | G06F18/2433;G06F18/2415;G06N20/00 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 孙蕾 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常 账户 分类 方法 装置 电子设备 存储 介质 | ||
1.一种异常账户的分类方法,包括:
获取待检测的M个账户数据,所述账户数据包括用于表征账户交易特征的数据;
将所述M个账户数据输入训练好的目标分类模型,输出与所述M个账户数据相匹配的M个分类结果,所述分类结果用于表征所述账户数据是否异常以及异常类型;
其中,所述目标分类模型是利用N个样本数据和所述N个样本数据的标签经T轮训练得到的,所述N个样本数据包括无标签的所述M个账户数据和(N-M)个有标签数据,所述N个样本数据的标签包括所述(N-M)个有标签数据的标准标签和所述M个账户数据的软标签,所述软标签是利用所述标准标签经T轮优化得到的,所述标准标签包括C个异常类型,T≥1,C≥1,N≥M≥1。
2.根据权利要求1所述的方法,其中,确定所述目标分类模型的过程包括:
根据所述N个样本数据和所述N个样本数据的标签,对初始分类模型进行T轮训练,将第T轮训练得到的第T分类模型作为所述目标分类模型;
其中,在每轮训练过程中,利用所述(N-M)个有标签数据的标准标签更新所述M个账户数据的软标签,所述软标签包括所述账户数据属于所述C个异常类型的概率。
3.根据权利要求2所述的方法,其中,根据所述N个样本数据和所述N个样本数据的标签,对初始分类模型进行T轮训练,将第T轮训练得到的第T分类模型作为所述目标分类模型,包括:
针对第t轮训练,2≤t≤T,获取第(t-1)轮训练过程中得到的第(t-1)分类模型、与所述M个账户数据对应的M个第(t-1)邻居数据集,其中,每个所述第(t-1)邻居数据集包括与所述账户数据最相似的K个第(t-1)有标签数据,K≥1;
将所述M个账户数据和所述(N-M)个有标签数据输入所述第(t-1)分类模型,输出第t1预测结果数据集,所述第t1预测结果数据集包括所述M个账户数据在第t轮第1次训练得到的M个预测结果、以及所述(N-M)个有标签数据在第t轮第1次训练得到的(N-M)个预测结果;
根据与每个账户数据对应的所述第(t-1)邻居数据集,计算与所述每个账户数据对应的第t软标签,得到与所述M个账户数据对应的M个第t软标签;以及
根据所述第t1预测结果数据集、所述M个第t软标签、(N-M)个所述标准标签优化所述第(t-1)分类模型,直至损失函数满足预设条件的情况下,得到第t分类模型。
4.根据权利要求3所述的方法,其中,所述根据所述第t1预测结果数据集、所述M个第t软标签、(N-M)个所述标准标签优化所述第(t-1)分类模型,直至损失函数满足预设条件的情况下,得到第t分类模型包括:
根据所述第t1预测结果数据集、所述M个第t软标签、(N-M)个所述标准标签,计算在第t轮第1次训练过程中第(t-1)分类模型的第一损失函数值;以及
根据所述损失函数值优化所述第(t-1)分类模型,得到第t1分类模型;
将所述M个账户数据和所述(N-M)个有标签数据输入所述第t1分类模型,输出第t2预测结果数据集,所述第t2预测结果数据集包括所述M个账户数据在第t轮第2次训练得到的M个预测结果、以及所述(N-M)个有标签数据在第t轮第2次训练得到的(N-M)个预测结果;
根据所述第t2预测结果数据集、所述M个第t软标签、(N-M)个所述标准标签计算第二损失函数值,经过多轮训练直至得到的损失函数值最小,确定所述第t分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310252743.7/1.html,转载请声明来源钻瓜专利网。