[发明专利]异常账户的分类方法、装置、电子设备及存储介质在审
申请号: | 202310252743.7 | 申请日: | 2023-03-07 |
公开(公告)号: | CN116304943A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 陈李龙;徐林嘉;张宏韬;卢健 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F18/2433 | 分类号: | G06F18/2433;G06F18/2415;G06N20/00 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 孙蕾 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常 账户 分类 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种异常账户的分类方法、装置、电子设备及存储介质,可以应用于大数据、信息安全技术领域。该分类方法包括:获取待检测的M个账户数据,账户数据包括用于表征账户交易特征的数据;将M个账户数据输入训练好的目标分类模型,输出M个分类结果,分类结果用于表征所述账户数据是否异常以及异常类型;目标分类模型是利用N个样本数据和N个样本数据的标签经T轮训练得到的,N个样本数据包括M个账户数据和(N‑M)个有标签数据,N个样本数据的标签包括(N‑M)个有标签数据的标准标签和M个账户数据的软标签,软标签是利用标准标签经T轮优化得到的,标准标签包括C个异常类型,T≥1,C≥1,N≥M≥1。
技术领域
本公开涉及大数据、信息安全技术领域,具体涉及一种异常账户的分类方法、装置、电子设备及存储介质。
背景技术
在异常账户识别场景中,一般利用有监督机器学习或半监督机器学习实现异常账户的识别。
对于有监督机器学习,一般通过预先标记的异常账户样本训练模型,这需要耗费大量人力物力进行打标操作。此外,由于某些隐藏账户在发生异常时未采取处理措施,使得打标不精确从而影响异常识别效果。对于半监督学习,一般通过预先给无标签样本赋予伪标签,将半监督学习模式转换为有监督学习模式,实现异常账户的识别。但是,错误的伪标签会导致模型学习到错误信息,影响异常账户识别效果。
发明内容
鉴于上述问题,本公开提供了一种异常账户的分类方法、装置、电子设备及存储介质。
根据本公开的第一个方面,提供了一种异常账户的分类方法,包括:
获取待检测的M个账户数据,账户数据包括用于表征账户交易特征的数据;
将M个账户数据输入训练好的目标分类模型,输出与M个账户数据相匹配的M个分类结果,分类结果用于表征账户数据是否异常以及异常类型;
其中,目标分类模型是利用N个样本数据和N个样本数据的标签经T轮训练得到的,N个样本数据包括无标签的M个账户数据和(N-M)个有标签数据,N个样本数据的标签包括(N-M)个有标签数据的标准标签和M个账户数据的软标签,软标签是利用标准标签经T轮优化得到的,标准标签包括C个异常类型,T≥1,C≥1,N≥M≥1。
根据本公开的实施例,其中,确定目标分类模型的过程包括:
根据N个样本数据和N个样本数据的标签,对初始分类模型进行T轮训练,将第T轮训练得到的第T分类模型作为目标分类模型;
其中,在每轮训练过程中,利用(N-M)个有标签数据的标准标签更新M个账户数据的软标签,软标签包括账户数据属于C个异常类型的概率。
根据本公开的实施例,其中,根据N个样本数据和N个样本数据的标签,对初始分类模型进行T轮训练,将第T轮训练得到的第T分类模型作为目标分类模型,包括:
针对第t轮训练,2≤t≤T,获取第(t-1)轮训练过程中得到的第(t-1)分类模型、与M个账户数据对应的M个第(t-1)邻居数据集,其中,每个第(t-1)邻居数据集包括与账户数据最相似的K个第(t-1)有标签数据,K≥1;
将M个账户数据和(N-M)个有标签数据输入第(t-1)分类模型,输出第t1预测结果数据集,第t1预测结果数据集包括M个账户数据在第t轮第1次训练得到的M个预测结果、以及(N-M)个有标签数据在第t轮第1次训练得到的(N-M)个预测结果;
根据与每个账户数据对应的第(t-1)邻居数据集,计算与每个账户数据对应的第t软标签,得到与M个账户数据对应的M个第t软标签;以及
根据第t1预测结果数据集、M个第t软标签、(N-M)个标准标签优化第(t-1)分类模型,直至损失函数满足预设条件的情况下,得到第t分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310252743.7/2.html,转载请声明来源钻瓜专利网。