[发明专利]一种基于聚类算法的实时拦截诈骗电话的方法和系统在审
申请号: | 201410693578.X | 申请日: | 2014-11-26 |
公开(公告)号: | CN104469025A | 公开(公告)日: | 2015-03-25 |
发明(设计)人: | 廖建新;王彦青;林大庆;林建洪;张锦然;单瑞超;马宪 | 申请(专利权)人: | 杭州东信北邮信息技术有限公司 |
主分类号: | H04M3/436 | 分类号: | H04M3/436 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100191 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 算法 实时 拦截 诈骗 电话 方法 系统 | ||
技术领域
本发明涉及一种基于聚类算法的实时拦截诈骗电话的方法和系统,属于网络通信技术领域。
背景技术
随着移动电话的普及,电话诈骗层出不穷。尽管政府有关部门已经向社会发出提醒,各类新闻媒体也频频报道,然而,每天仍有大量用户上当受骗,且经济损失呈逐年上升趋势。
目前对诈骗电话主要采取的是黑名单拦截方式,即将已确认诈骗号码写入黑名单中。例如:专利申请CN 201310004829.4(申请名称:一种基于通话模式识别的垃圾呼叫拦截系统及其工作方法,申请人:上海欣方智能系统有限公司,申请日:2013‐01‐07)基于电话用户听到语音提示时的行为习惯和结合语音识别技术而提出,该系统需要在现有通信网的关口局或汇接局交换机上配置疑似风险的电话用户号码,并同时能根据用户签约的呼叫拦截业务属性,将疑似垃圾呼叫的信令消息流和媒体流分别送入该系统执行呼叫拦截分析操作;还要增设下述装置:通话模式识别及呼叫拦截服务器及其业务数据库、音频分析服务器、信令网关和媒体网关。由于诈骗份子的手段在不断变换,诈骗号码越来越隐蔽,其形式也越来越多样化,尽管越来越多的诈骗号码被发现和确认,但是相对于全网所存在的诈骗电话来说,已确认诈骗号码只是其中很小的一部分。该技术方案并未涉及到全网范围内对诈骗号码的自动精准识别和实时拦截。
因此,在全网范围内实现诈骗号码的自动精准识别和实时拦截,是一个值得深入研究的技术问题。
发明内容
有鉴于此,本发明的目的是提供一种基于聚类算法的实时拦截诈骗电话的方法和系统,能在全网范围内实现诈骗号码的自动精准识别和实时拦截。
为了达到上述目的,本发明提供了一种基于聚类算法的实时拦截诈骗电话的方法,包括有:
步骤一、根据所采集的话单记录,计算所有主叫号码在一定时间周期内的若干个特征指标值,然后采用聚类算法将所有主叫号码划分到三个簇中,从而使得每个簇中的主叫号码具有相同或相近的特征指标值;
步骤二、将已确认诈骗号码的特征指标值分别和三个簇中主叫号码的特征指标值进行匹配,如果特征指标值所构成的取值区间越接近则说明匹配相似度越高,最后将其中匹配相似度最高的簇设置为诈骗电话簇、匹配相似度次之的簇设置为疑似诈骗电话簇;
步骤三、将诈骗号码簇、和疑似诈骗号码簇中的所有主叫号码分别更新到取证号码表、和拦截号码表中。
为了达到上述目的,本发明还提供了一种基于聚类算法的实时拦截诈骗电话的系统,包括有防诈骗平台,其中,防诈骗平台进一步包括有:
聚类分析装置,用于根据所采集的话单记录,计算所有主叫号码在一定时间周期内的若干个特征指标值,然后采用聚类算法将所有主叫号码划分到三个簇中,从而使得每个簇中的主叫号码具有相同或相近的特征指标值,再将已确认诈骗号码的特征指标值分别和三个簇中主叫号码的特征指标值进行匹配,如果特征指标值所构成的取值区间越接近则说明匹配相似度越高,最后将其中匹配相似度最高的簇设置为诈骗电话簇、匹配相似度次之的簇设置为疑似诈骗电话簇;
号码表更新装置,用于将诈骗号码簇、和疑似诈骗号码簇中的所有主叫号码分别更新到取证号码表、和拦截号码表中。
与现有技术相比,本发明的有益效果是:本发明通过聚类算法进行特征分类,将具有相同或相似特征的主叫号码分别划分到诈骗号码簇和疑似诈骗号码簇中,然后再各自根据逻辑回归算法遴选出确定的诈骗号码和疑似诈骗号码,从而能在全网范围内实现诈骗号码的自动精准识别和实时拦截;对于诈骗号码,本发明进一步进行录音取证,并将录音文件保存到样本库中,从而能保证样本库中的信息越来越丰富,诈骗电话的识别精度越来越高;对于疑似诈骗号码,本发明进一步将其录音文件和样本库中的诈骗样本进行自动识别,特别对于播放录音的诈骗电话,通过对语音进行时间和能量的双纬度特征值分析,从而能有效区分出不同语音,当识别出录音文件和诈骗样本是相同语音时,则对正在进行的通话实时拦截中断。
附图说明
图1是本发明一种基于聚类算法的实时拦截诈骗电话的方法的流程图。
图2是图1步骤一的具体操作流程图。
图3是当用户发起呼叫时,对其分别实施录音取证和实时拦截的具体操作流程图。
图4是将录音文件和重复音样本库中的诈骗样本一一比对的具体操作流程图。
图5是本发明一种基于聚类算法的实时拦截诈骗电话的系统的组成结构示意图。
图6是聚类分析装置的组成结构示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州东信北邮信息技术有限公司,未经杭州东信北邮信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410693578.X/2.html,转载请声明来源钻瓜专利网。