[发明专利]一种诈骗号码识别方法、装置、计算机设备及存储介质有效
申请号: | 202011176102.0 | 申请日: | 2020-10-29 |
公开(公告)号: | CN112291424B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 钱沁莹;葛胜利;汲丽 | 申请(专利权)人: | 上海观安信息技术股份有限公司 |
主分类号: | H04M3/22 | 分类号: | H04M3/22;H04W12/128;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京艾皮专利代理有限公司 11777 | 代理人: | 刘刚 |
地址: | 201800 上海市嘉定*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 诈骗 号码 识别 方法 装置 计算机 设备 存储 介质 | ||
1.一种诈骗号码识别方法,其特征在于,包括:
获取待识别号码的通讯特征信息;所述通讯特征信息至少包括基站数据、通话数据、短信数据、流量数据的一种或两种以上;
根据预设的诈骗号码识别模型对所述通讯特征信息进行处理,生成诈骗号码识别结果;所述预设的诈骗号码识别模型是预先基于半监督学习的自训练分类算法训练生成的;
训练生成所述预设的诈骗号码识别模型的步骤,具体包括:
获取有标签数据集以及无标签数据集;所述有标签数据集包含多个携带有诈骗号码识别结果信息以及通讯特征信息的有标签样本号码;所述无标签数据集包含多个携带有通讯特征信息的无标签样本号码;
将所述有标签数据集确定为训练集并基于预设的训练规则训练出当前识别效果最优的诈骗号码识别老师模型;
根据所述诈骗号码识别老师模型对所述无标签数据集进行识别处理,确定所述多个无标签样本号码的诈骗结果预测概率;
将诈骗结果预测概率超过预设的置信度阈值的无标签样本号码更新为伪标签数据集;
将所述有标签数据集以及伪标签数据集确定为新的训练集,并根据预设的训练规则训练生成诈骗号码识别学生模型;所述诈骗号码识别学生模型的识别效果优于所述诈骗号码识别老师模型;
判断是否满足预设的训练结束条件;
当判断不满足预设的训练结束条件时,将所述诈骗号码识别学生模型确定为新的诈骗号码识别老师模型并返回至所述根据所述诈骗号码识别老师模型对所述无标签数据集进行识别处理,确定所述多个无标签样本号码的诈骗结果预测概率的步骤;
当判断满足预设的训练结束条件时,将所述诈骗号码识别学生模型确定训练生成的诈骗号码识别模型。
2.根据权利要求1所述的诈骗号码识别方法,其特征在于,所述预设的诈骗号码识别模型是预先基于改进的自训练分类算法训练生成的:所述改进的自训练分类算法在训练生成学生模型的过程中引入了随机噪音信息;
所述根据预设的训练规则训练生成诈骗号码识别学生模型的步骤具体为:
根据预设的训练规则训练以及预设的噪音添加规则生成诈骗号码识别学生模型。
3.根据权利要求2所述的诈骗号码识别方法,其特征在于,所述预设的噪音添加规则包括用于在训练集中添加噪音的数据噪音添加规则以及在诈骗号码识别学生模型中添加噪音的模型噪音添加规则;所述模型噪音添加规则包括dropout、随机深度以及随机增强中的一种或两种以上。
4.根据权利要求1所述的诈骗号码识别方法,其特征在于,所述通讯特征信息还包括主叫设备号;在所述根据预设的诈骗号码识别模型对所述通讯特征信息进行处理,生成诈骗号码识别结果的步骤之后,还包括:
判断所述待识别号码的主叫设备号是否满足预设的诈骗特征;
当判断所述待识别号码的主叫设备号满足预设的诈骗特征时,确认所述待识别号码为诈骗号码。
5.根据权利要求1所述的诈骗号码识别方法,其特征在于,在所述根据预设的诈骗号码识别模型对所述通讯特征信息进行处理,生成诈骗号码识别结果的步骤之后,还包括:
在确定所述待识别号码为诈骗号码后,根据所述通讯特征信息以及预设的受害群体识别规则确定受害群体。
6.根据权利要求5所述的诈骗号码识别方法,其特征在于,所述根据所述通讯特征信息以及预设的受害群体识别规则确定受害群体的步骤,具体包括:
根据所述通讯特征信息确定与所述诈骗号码存在通讯交互行为的敏感号码;
根据所述敏感号码与所述诈骗号码的通话时长、通话次数以及所述敏感号码是否与其他诈骗号码存在通讯交互行为的判断结果判断所述敏感号码是否属于受害群体。
7.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至6中任一项权利要求所述诈骗号码识别方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至6中任一项权利要求所述诈骗号码识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海观安信息技术股份有限公司,未经上海观安信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011176102.0/1.html,转载请声明来源钻瓜专利网。