[发明专利]诈骗识别模型训练方法、装置、电子设备及存储介质在审
申请号: | 202211258727.0 | 申请日: | 2022-10-14 |
公开(公告)号: | CN115659217A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 何志伟;何全胜;邹晓聪;祝安邦;蓝子扬;黄贝珊;郦敏懿 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F18/24 | 分类号: | G06F18/24;G06F18/214;G06N20/00;H04W12/128 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 诈骗 识别 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种诈骗识别模型训练方法,其特征在于,所述方法包括:
根据欺诈业务数据,获取具有目标设备诈骗行为的多种类型特征的关键特征集;
根据历史诈骗业务数据和所述关键特征集,获取目标设备对应的诈骗行为数据集;
基于所述关键特征集和所述诈骗行为数据集对预先构建的诈骗识别模型进行训练,得到目标诈骗识别模型。
2.根据权利要求1所述的方法,其特征在于,所述根据欺诈业务数据,获取具有目标设备诈骗行为的多种类型特征的关键特征集,包括:
提取所述欺诈业务数据中的设备行为类型的第一特征;
提取所述欺诈业务数据中的诈骗行为类型的第二特征;
提取所述欺诈业务数据中的位置切换速度类型的第三特征;
根据所述第一特征、所述第二特征和所述第三特征,生成所述目标设备诈骗行为的关键特征集。
3.根据权利要求2所述的方法,其特征在于,所述提取所述欺诈业务数据中的设备行为类型的第一特征,包括:
提取所述欺诈业务数据中同一基站下多个号码在同一时刻以第一信号强度呼叫的第四特征,其中,所述第一信号强度大于信号强度阈值;和/或
提取所述欺诈业务数据中同一基站下多个号码在同一时刻开机/关机的第五特征;和/或
提取所述欺诈业务数据中多个号码经过N个基站,且基站轨迹相同的第六特征,N为大于等于2的正整数;和/或
提取所述欺诈业务数据中号码呼叫间隔时间与机器拨打号码规律相同的第七特征;
将所述第四特征、和/或所述第五特征、和/或所述第六特征、和/或所述第七特征,作为所述设备行为类型的第一特征。
4.根据权利要求2所述的方法,其特征在于,所述提取所述欺诈业务数据中的诈骗行为类型的第二特征,包括:
提取所述欺诈业务数据中主呼叫量大于主叫阈值的第八特征;和/或
提取所述欺诈业务数据中主呼叫次数与主被呼叫次数的比值大于比例阈值的第九特征;和/或
提取所述欺诈业务数据中主呼叫挂断率大于挂断率阈值的第十特征;和/或
提取所述欺诈业务数据中主呼叫振铃时长大于时长阈值的第十一特征;和/或
提取所述欺诈业务数据中通话时长低于通话时长阈值的第十二特征;和/或
提取所述欺诈业务数据中通话时长在设定时长区间的比例的第十三特征;和/或
提取所述欺诈业务数据中呼叫号码的呼叫时间集中于设定时间区域的第十四特征;和/或
提取所述欺诈业务数据中被叫号码的重叠度低于重叠度阈值的第十五特征;和/或
提取所述欺诈业务数据中在同一时段内从同一基站发出呼叫的第十六特征;和/或
提取所述欺诈业务数据中在同一时段内的号码中存在强关联的号码的第十七特征;和/或
提取所述欺诈业务数据中拨打特殊号码的第十八特征;和/或
提取所述欺诈业务数据中号码活跃天数低于活跃天数阈值的第十九特征;和/或
提取所述欺诈业务数据中被叫号码归属地数量大于归属地数量阈值的第二十特征;
将所述第八特征、和/或所述第九特征、和/或所述第十特征、和/或所述第十一特征、和/或所述第十二特征、和/或所述第十三特征、和/或所述第十四特征、和/或所述第十五特征、和/或所述第十六特征、和/或所述第十七特征、和/或所述第十八特征、和/或所述第十九特征、和/或所述第二十特征,作为所述诈骗行为类型的第二特征。
5.根据权利要求2所述的方法,其特征在于,所述提取所述欺诈业务数据中的位置切换速度类型的第三特征,包括:
提取所述欺诈业务数据中号码位置切换的平均速度大于速度阈值的特征,作为所述位置切换速度类型的第三特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211258727.0/1.html,转载请声明来源钻瓜专利网。