[发明专利]垃圾电话数据处理方法及系统在审
申请号: | 202110963208.3 | 申请日: | 2021-08-20 |
公开(公告)号: | CN113691681A | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 陈帅 | 申请(专利权)人: | 北京琥珀创想科技有限公司 |
主分类号: | H04M3/22 | 分类号: | H04M3/22;H04M3/436;H04W12/128;H04L29/08 |
代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 胡乐 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 垃圾 电话 数据处理 方法 系统 | ||
本发明公开了一种垃圾电话数据处理方法及系统,包括号码风险等级以及风险类型标签的定义;用户根据风险类型标签对可疑号码进行标记;系统以原始的记录形式,快速存储用户标记的号码信息并进行预处理,然后将处理后的数据存入数据库软件中;根据风险等级定义,计算每个号码的风险权重后保存或者更新数据库软件中的号码风险权重信息;在线查询电话号码的风险等级,并且生成加密的高风险号码离线数据库,便于用户对电话号码的风险等级进行离线查询。本发明提供的垃圾电话数据处理方法及系统直接对接用户并进行数据处理,每天系统会根据用户上报的数据实时更新,每日更新使单次数据量减少,从而提高更新的效率。
技术领域
本发明涉及数据处理技术领域,具体涉及一种垃圾电话数据处理方法及系统。
背景技术
垃圾电话是指向用户拨打的用户不愿意接听或者拒绝接听的推销、诈骗或者其它类型的电话,垃圾电话的泛滥,已经严重影响到人们正常生活、运营商形象乃至社会稳定。
虽然现在有很多垃圾电话的处理方法和系统,但是现有垃圾电话数据收集主要是定期批量更新旧的数据集,在效率和时效性上都有所欠缺,而且批量更新会导致整个系统运行效率慢,定期处理导致信息更新不及时和垃圾电话数据过时,人们在日常生活中依旧会不断遭受到新的垃圾电话的骚扰。
发明内容
为此,本发明实施例提供一种垃圾电话数据处理方法及系统,以解决现有技术存在的垃圾电话数据定期批量更新,导致运行效率慢,垃圾电话数据过时的问题。
为了实现上述目的,本发明实施例提供如下技术方案:
第一方面,一种垃圾电话数据处理方法,包括:
获取并解析用户标记的号码信息;所述用户标记的号码信息包括号码、风险标签代码和时间戳;
将解析后的所述用户标记的号码信息存入数据库软件中;
对于每一个所述用户标记的号码信息,根据其中的风险标签代码和预先设定的风险等级定义,计算号码的风险权重值;
若所述号码为首次标记,则在数据库软件中记录该号码的风险权重值;
若所述号码为在数据库软件中已有记录,则在数据库软件中更新该号码的风险权重值;
根据最新的所述风险权重值,在线查询号码的风险等级,并生成加密的高风险号码离线数据库,用于用户对电话号码的风险等级进行离线查询。
进一步的,对于用户的标记请求,采用异步处理的存储方式,通过网站服务器软件Nginx的日志记录系统,自动保存为日志文件,并被上传至云端平台;所述用户标记的号码信息是来自所述云端平台存储的日志文件;
所述用户标记的号码信息,在自动保存为日志文件之前,还使用AES加密算法作了加密处理。
进一步的,在计算号码的风险权重时,使用多进程分页查询数据库表,根据各个标签的评分值,进行累加计算号码的风险权重,最后将号码解析成国家区号和号码的格式,与号码对应的风险权重值一起存入到所述数据存储模块中。
进一步的,所述累加计算方法是将号码存到一个以号码-权重值为键值对的集合中,最后将所述集合中的号码解析成国家区号和号码的格式。
进一步的,解析用户标记的号码信息时通过正则表达式匹配,按行过滤日志文件中的关键信息,最后处理生成JSON格式的文件。
进一步的,还包括:离线数据库模块按国家分类,将高风险的号码导入到加密的数据库文件中,并与之前保存的离线数据库文件进行对比,生成差分文件。
进一步的,所述风险标签包括:推销、诈骗、生活服务、其他、正常号码和响铃一声6种类型。
进一步的,所述风险等级包括:高风险、中风险和安全3个等级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京琥珀创想科技有限公司,未经北京琥珀创想科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110963208.3/2.html,转载请声明来源钻瓜专利网。