[发明专利]一种基于LTE信令的数据过滤处理方法有效

专利信息
申请号: 201510694999.9 申请日: 2015-10-21
公开(公告)号: CN105306296B 公开(公告)日: 2018-10-12
发明(设计)人: 窦慧晶;卞婷婷 申请(专利权)人: 北京工业大学
主分类号: H04L12/26 分类号: H04L12/26;H04L29/06
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 沈波
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 lte 数据 过滤 处理 方法
【说明书】:

发明涉及一种基于LTE信令的数据过滤处理方法。具体为对LTE移动核心高速网络系统进行大数据的过滤处理,采用简单过滤和内容深层过滤相结合的四级混合过滤模式。首先通过五元组进行简单数据预处理,然后根据KNN文本分类法确定数据源性质,再采用优化的AdaBoost算法实现基于内容的三级信息过滤,最终实现一个完整的数据过滤处理。与传统的过滤方法相比,本方法解决了传统的LTE系统对数据过滤方面遗失和筛选错误的问题,具有较好的稳定性和准确率,对于数据的过滤有很好鲁棒性。本发明可直接应用于网络安全、网络信息数据处理、大数据分析等领域。

技术领域

本发明涉及一种基于LTE信令的数据过滤处理方法,属于数据过滤处理技术领域。

背景技术

五元组简单数据过滤,是指首先定义变量SIP、DIP、SP、DP、PT分别为五元组过滤中的源IP地址、目的IP地址、源端口号、目的端口号和传输协议类型,它们构成了五元组的基本元素。在一次会话中,根据过滤策略确定掩码SIP_MASK、DIP_MASK、SP_MASK、DP_MASK和PT_MASK的值,组成PCL(Policy Control List,策略控制列表),根据需求进行信息一级过滤。

KNN(KeyNearestNeighbor)算法是一种基于统计的模式识别算法,主要被用在文本分类中,其基本思想是:在新文本给定后,考虑在训练文本集中与该文本距离最近(即为最相似)的一篇文本,根据这篇文本所属的类别来判断新文本所属的类别。也就是说,把每一篇文本都看作是一个N维向量,计算新文本与训练文本集中文本的距离,通过距离来确定新文本的类别。

优化的AdaBoost算法是基于AdaBoost算法的最小风险贝叶斯深层过滤算法。以AdaBoost算法作为分类器的训练框架,用最小风险贝叶斯分类算法代替AdaBoost算法中的弱分类器,作为AdaBoost的分类器,最终达成两个算法的结合。最小风险贝叶斯分类算法就是以贝叶斯和朴素贝叶斯为基础来解决错误率问题,是最小错误率意义上的最优化。贝叶斯分类算法是通过某对象的先验概率模型,利用贝叶斯公式计算出其后验概率。从而得到对象源的主题(选择具有最大后验概率的类作为对象源所属的主题)。通过训练源数据集合,由贝叶斯分类算法得到每个数据信息在不同类的概率大小,构造出贝叶斯分类模型,朴素贝叶斯就是贝叶斯分类模型中误差率最小的,并且其所需估计参数很少,实现算法十分简单。AdaBoost算法是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后将这些弱分类器集合起来,最终构成一个最强的最终分类器(强分类器)。算法的主要特点有:

1.采用五元组简单过滤算法、KNN文本分类方法和改进的AdaBoost方法进行三级深层内容的信息过滤,有效的保证了系统的过滤性能与鲁棒性;

2.高速性,准确性。KNN文本分类算法可以根据用户自身的需要来选择适合的文档,过滤掉无用的文档,对大量的网络数据进行快速、有效地自动分类,适用于在海量数据中进行信息筛选;

3.经优化的AdaBoost算法可以排除一些不必要的训练数据特征,关注于关键的训练数据,并且按照不同的主题过滤策略对数据进行过滤,把所有分类错误的可能性都考虑进去,很大程度上降低误判的风险;

4.降低系统负荷,提高系统运行效率。采用聚类分析方法对样本库进行自动组织与分类。

5.稳定性,通过三级过滤,可以极大提升过滤功能处理能力。

但是对于KNN文本分类算法,该算法也存在缺陷,当样本数量不平衡时,如一个类的样本容量很大,而其他类样本容量很小时,有可能导致当输入一个新样本时,该样本的K个邻居中大容量类的样本占多数,因为该算法只计算“最近的”邻居样本,所以当某一类的样本数量很大时,会导致新样本无法匹配到正确的样本,可以采用改变权值的方法(增大与该样本距离小的邻居的权值)来进行改进,但会带来算法的复杂度。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510694999.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top