[发明专利]异常账户的分类方法、装置、电子设备及存储介质在审

专利信息
申请号: 202310252743.7 申请日: 2023-03-07
公开(公告)号: CN116304943A 公开(公告)日: 2023-06-23
发明(设计)人: 陈李龙;徐林嘉;张宏韬;卢健 申请(专利权)人: 中国工商银行股份有限公司
主分类号: G06F18/2433 分类号: G06F18/2433;G06F18/2415;G06N20/00
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 孙蕾
地址: 100140 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 异常 账户 分类 方法 装置 电子设备 存储 介质
【说明书】:

本公开提供了一种异常账户的分类方法、装置、电子设备及存储介质,可以应用于大数据、信息安全技术领域。该分类方法包括:获取待检测的M个账户数据,账户数据包括用于表征账户交易特征的数据;将M个账户数据输入训练好的目标分类模型,输出M个分类结果,分类结果用于表征所述账户数据是否异常以及异常类型;目标分类模型是利用N个样本数据和N个样本数据的标签经T轮训练得到的,N个样本数据包括M个账户数据和(N‑M)个有标签数据,N个样本数据的标签包括(N‑M)个有标签数据的标准标签和M个账户数据的软标签,软标签是利用标准标签经T轮优化得到的,标准标签包括C个异常类型,T≥1,C≥1,N≥M≥1。

技术领域

本公开涉及大数据、信息安全技术领域,具体涉及一种异常账户的分类方法、装置、电子设备及存储介质。

背景技术

在异常账户识别场景中,一般利用有监督机器学习或半监督机器学习实现异常账户的识别。

对于有监督机器学习,一般通过预先标记的异常账户样本训练模型,这需要耗费大量人力物力进行打标操作。此外,由于某些隐藏账户在发生异常时未采取处理措施,使得打标不精确从而影响异常识别效果。对于半监督学习,一般通过预先给无标签样本赋予伪标签,将半监督学习模式转换为有监督学习模式,实现异常账户的识别。但是,错误的伪标签会导致模型学习到错误信息,影响异常账户识别效果。

发明内容

鉴于上述问题,本公开提供了一种异常账户的分类方法、装置、电子设备及存储介质。

根据本公开的第一个方面,提供了一种异常账户的分类方法,包括:

获取待检测的M个账户数据,账户数据包括用于表征账户交易特征的数据;

将M个账户数据输入训练好的目标分类模型,输出与M个账户数据相匹配的M个分类结果,分类结果用于表征账户数据是否异常以及异常类型;

其中,目标分类模型是利用N个样本数据和N个样本数据的标签经T轮训练得到的,N个样本数据包括无标签的M个账户数据和(N-M)个有标签数据,N个样本数据的标签包括(N-M)个有标签数据的标准标签和M个账户数据的软标签,软标签是利用标准标签经T轮优化得到的,标准标签包括C个异常类型,T≥1,C≥1,N≥M≥1。

根据本公开的实施例,其中,确定目标分类模型的过程包括:

根据N个样本数据和N个样本数据的标签,对初始分类模型进行T轮训练,将第T轮训练得到的第T分类模型作为目标分类模型;

其中,在每轮训练过程中,利用(N-M)个有标签数据的标准标签更新M个账户数据的软标签,软标签包括账户数据属于C个异常类型的概率。

根据本公开的实施例,其中,根据N个样本数据和N个样本数据的标签,对初始分类模型进行T轮训练,将第T轮训练得到的第T分类模型作为目标分类模型,包括:

针对第t轮训练,2≤t≤T,获取第(t-1)轮训练过程中得到的第(t-1)分类模型、与M个账户数据对应的M个第(t-1)邻居数据集,其中,每个第(t-1)邻居数据集包括与账户数据最相似的K个第(t-1)有标签数据,K≥1;

将M个账户数据和(N-M)个有标签数据输入第(t-1)分类模型,输出第t1预测结果数据集,第t1预测结果数据集包括M个账户数据在第t轮第1次训练得到的M个预测结果、以及(N-M)个有标签数据在第t轮第1次训练得到的(N-M)个预测结果;

根据与每个账户数据对应的第(t-1)邻居数据集,计算与每个账户数据对应的第t软标签,得到与M个账户数据对应的M个第t软标签;以及

根据第t1预测结果数据集、M个第t软标签、(N-M)个标准标签优化第(t-1)分类模型,直至损失函数满足预设条件的情况下,得到第t分类模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310252743.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top