[发明专利]一种以大数据流式技术实现网络数据包的分析方法及系统有效
申请号: | 201910985537.0 | 申请日: | 2019-10-17 |
公开(公告)号: | CN110650212B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 陈鹏;王树志;张磊;袁思静 | 申请(专利权)人: | 国科元科技(北京)有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L12/24 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据流 技术 实现 网络 数据包 分析 方法 系统 | ||
1.一种以大数据流式技术实现网络数据包的分析方法,其特征在于,包括如下步骤:
步骤100、接收连接开始和连接结束之间的数据,划分数据包的属性信息,按照时间顺序将数据包先后排序;
步骤200、选择数据包的属性,根据不同的属性组合形式筛选数据流,关联数据包属性的映射关系, 统计两个以上相关属性之间的对应关系;
步骤300、根据数据包属性的映射信息,筛选出映射信息相同属性不同的数据流,关联计算两个以上相关属性之间的对应关系;
在步骤300中,先确定一个目的端口地址追踪的用户基本信息,根据当前目的端口地址映射的浏览项关键信息,关联浏览项关键信息相同的目的端口地址;
再根据关联的目的端口地址筛选数据流,追踪筛选出的目的端口地址映射的用户基本信息;
最后,整体统计具有相同浏览项关键信息的目的端口地址对应的源IP地址,分析同一类浏览项关键信息对应的用户基本信息。
2.根据权利要求1所述的一种以大数据流式技术实现网络数据包的分析方法,其特征在于:在步骤100中,数据包的属性信息包括数据响应时间、源IP地址、目的端口地址、传输类型和关注时长。
3.根据权利要求2所述的一种以大数据流式技术实现网络数据包的分析方法,其特征在于:所述源IP地址和目的端口地址分别链接有映射关系,追踪所述源IP地址映射到用户基本信息,追踪所述目的端口地址映射到浏览项关键信息。
4.根据权利要求3所述的一种以大数据流式技术实现网络数据包的分析方法,其特征在于:所述用户基本信息主要包括用户姓名、性别、年龄、电话号码和生活所在区域,所述浏览项关键信息主要包括小区所在位置、面积大小、装修情况以及有无学区。
5.根据权利要求3所述的一种以大数据流式技术实现网络数据包的分析方法,其特征在于,在步骤200中,根据数据包的属性信息组合,分别获取每一个目的端口地址匹配的源IP地址,统计目的端口地址的源IP地址数量,以及源IP地址映射的用户基本信息,从而分析目的端口地址的受众用户,筛选目的端口地址对应源IP地址信息的具体步骤为:
获取一个目的端口地址相同的数据包,从所有数据包内筛选出同一目的端口地址的数据流;
统计同一目的端口地址数据包中的源IP地址,追踪源IP地址映射的用户基本信息;
统计用户基本信息的年龄分布和性别占比情况,分析每一个浏览项关键信息匹配的受众用户信息。
6.根据权利要求5所述的一种以大数据流式技术实现网络数据包的分析方法,其特征在于,在步骤200中,根据数据包的属性信息组合,分别获取每一个用户基本信息匹配的浏览项关键信息,统计源IP地址对应的目的端口地址数量,以及源IP地址匹配的目的端口地址关注时长,分析每一个用户的喜好的步骤具体为:
随机挑选一个源IP地址,获取同一源IP地址数据流中的目的端口地址;
统计同一目的端口地址出现的次数,确定用户对每一条信息的浏览次数,按照次数大小对目的端口地址排序;
计算每一个目的端口地址浏览关注总时长,按照总时长大小对目的端口地址排序;
累加目的端口地址浏览次数和浏览关注总时长参数,按照从大到小的顺序重新对同一源IP地址浏览的不同目的端口地址关注度排序;
统计每个目的端口地址对应的浏览项关键信息,分析用户对应的喜好。
7.根据权利要求6所述的一种以大数据流式技术实现网络数据包的分析方法,其特征在于:在步骤300中,确定一个源IP地址追踪的浏览项关键信息后,根据当前源IP地址映射的用户基本信息,关联用户基本信息相同的源IP地址;
再根据关联的用户基本信息的源IP地址筛选数据流,追踪筛选出的目的端口地址映射的浏览项关键信息;
最后,整体统计具有相同用户基本信息的源IP地址对应的浏览项关键信息,分析同一类用户基本信息对应的浏览项关键信息。
8.一种以大数据流式技术实现网络数据包的分析系统,其特征在于,包括:
源IP映射模块(1),用于追踪每个源IP地址对应的用户信息;
目的IP映射模块(2),用于追踪每个目的端口地址对应的关键信息;
属性筛选单元(3),用于根据源IP地址或者目的端口地址,确定每个信息的受众用户,以及每个用户的喜好信息;
源IP信息关联模块(4),用于根据源IP地址的映射信息,关联映射信息相同的用户,统计该用户的浏览记录,计算信息相同的用户浏览的喜好顺序;
目的IP信息关联模块(5),用于根据目的端口地址的映射信息,关联映射信息相同的目的端口地址,统计该目的端口地址对应的源IP地址的映射信息,分析关键信息相同的浏览项对应的受众用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国科元科技(北京)有限公司,未经国科元科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910985537.0/1.html,转载请声明来源钻瓜专利网。