[发明专利]垃圾电话数据处理方法及系统在审
申请号: | 202110963208.3 | 申请日: | 2021-08-20 |
公开(公告)号: | CN113691681A | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 陈帅 | 申请(专利权)人: | 北京琥珀创想科技有限公司 |
主分类号: | H04M3/22 | 分类号: | H04M3/22;H04M3/436;H04W12/128;H04L29/08 |
代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 胡乐 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 垃圾 电话 数据处理 方法 系统 | ||
1.一种垃圾电话数据处理方法,其特征在于,包括:
获取并解析用户标记的号码信息;所述用户标记的号码信息包括号码、风险标签代码和时间戳;
将解析后的所述用户标记的号码信息存入数据库软件中;
对于每一个所述用户标记的号码信息,根据其中的风险标签代码和预先设定的风险等级定义,计算号码的风险权重值;
若所述号码为首次标记,则在数据库软件中记录该号码的风险权重值;
若所述号码为在数据库软件中已有记录,则在数据库软件中更新该号码的风险权重值;
根据最新的所述风险权重值,在线查询号码的风险等级,并生成加密的高风险号码离线数据库,用于用户对电话号码的风险等级进行离线查询。
2.根据权利要求1所述的垃圾电话数据处理方法,其特征在于,对于用户的标记请求,采用异步处理的存储方式,通过网站服务器软件Nginx的日志记录系统,自动保存为日志文件,并被上传至云端平台;所述用户标记的号码信息是来自所述云端平台存储的日志文件;
所述用户标记的号码信息,在自动保存为日志文件之前,还使用AES加密算法作了加密处理。
3.根据权利要求1所述的垃圾电话数据处理方法,其特征在于,在计算号码的风险权重时,使用多进程分页查询数据库表,根据各个标签的评分值,进行累加计算号码的风险权重,最后将号码解析成国家区号和号码的格式,与号码对应的风险权重值一起存入到所述数据存储模块中。
4.根据权利要求3所述的垃圾电话数据处理方法,其特征在于,所述累加计算方法是将号码存到一个以号码-权重值为键值对的集合中,最后将所述集合中的号码解析成国家区号和号码的格式。
5.根据权利要求1所述的垃圾电话数据处理方法,其特征在于,解析用户标记的号码信息时通过正则表达式匹配,按行过滤日志文件中的关键信息,最后处理生成JSON格式的文件。
6.根据权利要求1所述的垃圾电话数据处理方法,其特征在于,还包括:离线数据库模块按国家分类,将高风险的号码导入到加密的数据库文件中,并与之前保存的离线数据库文件进行对比,生成差分文件。
7.根据权利要求1所述的垃圾电话数据处理方法,其特征在于,所述风险标签包括:推销、诈骗、生活服务、其他、正常号码和响铃一声6种类型。
8.根据权利要求1所述的垃圾电话数据处理方法,其特征在于,所述风险等级包括:高风险、中风险和安全3个等级。
9.根据权利要求1所述的垃圾电话数据处理方法,其特征在于,更新号码的风险权重值时是根据标签的评分值对该电话号码的风险权重进行累加或者累减。
10.一种垃圾电话数据处理系统,其特征在于,包括:
网络传输模块,用于将用户标记的可疑号码信息加密上传到日志记录模块;
日志记录模块,用于保存可疑号码信息;
云平台上传模块,用于每天定时将保存有可疑号码信息的日志文件压缩后上传到云端平台;
云平台下载模块,用于每天定时从云端平台将压缩的日志文件下载下来后进行解压;
日志预处理模块,用于将解压后的日志文件进行处理生成JSON格式的文件;
权重计算模块,用于根据标签模块中的评分规则,计算号码的风险权重;
标签模块,用于存储风险类型标签和风险等级;
数据存储模块,用于存储号码和与号码对应的风险权重值;
离线数据库模块,用于按国家分类,将高风险的号码导入到加密的数据库文件中,并与之前保存的离线数据库文件进行对比,生成差分文件;
接口模块,用于用户对风险号码的查询;
容灾模块,用于中断后恢复遗漏数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京琥珀创想科技有限公司,未经北京琥珀创想科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110963208.3/1.html,转载请声明来源钻瓜专利网。