[发明专利]基于时间分段特征统计的数据安全异常检测方法及系统在审
| 申请号: | 202110157348.1 | 申请日: | 2021-02-05 |
| 公开(公告)号: | CN112512052A | 公开(公告)日: | 2021-03-16 |
| 发明(设计)人: | 陈晓莉;丁一帆;徐佳丽;杨世宏;林建洪 | 申请(专利权)人: | 浙江鹏信信息科技股份有限公司 |
| 主分类号: | H04W12/128 | 分类号: | H04W12/128;G06N3/04;G06N3/08 |
| 代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
| 地址: | 311100 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 时间 分段 特征 统计 数据 安全 异常 检测 方法 系统 | ||
本发明公开了基于时间分段特征统计的数据安全异常检测方法及系统,其中涉及的基于时间分段特征统计的数据安全异常检测方法,包括:S1.采集多种类号码的通话话单数据;S2.对采集到的号码相对应的通话话单数据中的每一条通话记录的时间基于预设时间范围进行分段,并对分段后时间相对应的通话记录进行打标签,得到4种类型的通话记录;S3.统计每小时通话话单数据中4种类型的通话个数,将每小时统计的4种类型的通话个数转化为相对应的96维特征,并统计24小时内的96维特征;96维特征为神经网络的输入的维度;S4.将统计的96维特征作为输入,构建神经网络检测模型;S5.将测试号码执行步骤S2‑S3,并通过构建的神经网络检测模型输出是否为不良号码的结果。
技术领域
本发明涉及通信安全以及机器学习技术领域,尤其涉及基于时间分段特征统计的数据安全异常检测方法及系统。
背景技术
新冠肺炎疫情复工复产期间,各地开始逐步解除限制恢复生产。在此期间,电信骚扰与诈骗也同步出现,且与疫情前相比攀升了35%。防疫期间从超市到药店,从小区物业到公交地铁,各机构与场所都要求登记个人信息,包括姓名、手机号、身份证都是必填,通过此类数据收集精准追溯到个人进行骚扰诈骗易如反掌,如果收集数据的人员与机构不能按照《个人信息安全规范》进行数据保护与脱敏处理,公开姓名、年龄、身份证号码、电话号码、家庭住址等个人信息或是非法倒卖此类信息,数据就会大量流入黑灰产业链,造成骚扰与诈骗飙升的状况。
公开号为CN107222865A的专利公布了一种基于可疑行为识别的通讯诈骗实时检测方法和系统,包括离线模型训练阶段与实时诈骗检测阶段;建立动作特征识别模型和动作特征风险预测模型,通过分析陌生来电的通话语音和短信内容,检测其异常的、可疑的行为来进行诈骗预测。来电语音通过语音转文字的方式将来电主叫方的通话内容转变成文字信息,与短信内容同时使用自然语言处理方法提取出动作行为特征,并判断对话中出现的动作行为特征中是否有包含隐私信息询问和恶意命令等在内的可疑行为的可能性。上述专利虽然能够实现快速准确的防通讯诈骗检测,降低用户被欺诈的可能性;但是上述专利是在通话时进行检测的,不能根据用户的通话话单进行分析。
针对以上现状,本专利提出的一种基于时间分段特征统计的数据安全异常检测方法及系统。
发明内容
本发明的目的是针对现有技术的缺陷,提供了基于时间分段特征统计的数据安全异常检测方法及系统。
为了实现以上目的,本发明采用以下技术方案:
基于时间分段特征统计的数据安全异常检测方法,包括步骤:
S1.采集多种类号码的通话话单数据;
S2.对采集到的号码相对应的通话话单数据中的每一条通话记录的时间基于预设时间范围进行分段,并对分段后时间相对应的通话记录进行打标签,得到4种类型的通话记录;
S3.统计每小时通话话单数据中4种类型的通话个数,将每小时统计的4种类型的通话个数转化为相对应的96维特征,并统计24小时内的96维特征;其中,96维特征为神经网络的输入的维度;
S4.将统计的96维特征作为输入,构建神经网络检测模型;
S5.将测试号码执行步骤S2-S3,并通过构建的神经网络检测模型输出是否为不良号码的结果。
进一步的,所述步骤S2中预设时间范围包括T=0s、0s<T≤10s、10s<T≤30s、T>30s;其中,T表示通话记录的时间。
进一步的,所述步骤S2中对分段后时间相对应的通话记录进行打标签具体为:
将T=0s的通话记录定义为silence通话类型;将0s<T≤10s的通话记录定义为short通话类型;将10s<T≤30s的通话记录定义为medium通话类型;将T>30s的通话记录定义为long通话类型。
进一步的,所述步骤S3包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江鹏信信息科技股份有限公司,未经浙江鹏信信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110157348.1/2.html,转载请声明来源钻瓜专利网。





