[发明专利]一种行为特征数据提取的方法及装置在审
申请号: | 201810576742.7 | 申请日: | 2018-06-05 |
公开(公告)号: | CN109063721A | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 雷璟;温涛 | 申请(专利权)人: | 中国电子科技集团公司电子科学研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 田卫平 |
地址: | 100041 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征数据 基准特征 权值向量 特征集 行为特征数据 删除 异常检测技术 用户行为数据 评估基准 输出稳定 数据对应 特征提取 提取特征 异常检测 预设距离 互信息 成邻 构建 预置 加权 反馈 分割 | ||
1.一种行为特征数据提取的方法,其特征在于,所述方法包括:
在获取到的用户行为数据中提取特征数据,根据所述特征数据构建特征集;
在所述特征集中逐一选择一特征数据为基准特征数据,按照预设距离阈值将所述特征集中除基准特征数据以外的特征数据加权分割成邻域和远域,通过互信息评估所述基准特征数据的权值;
将所述权值反馈到所述基准特征数据对应的权值向量中,并在所述特征集中删除权值最小的特征数据;
逐次删除权值最小的特征数据,在所述特征集对应特征数据的数目及所述权值向量稳定时,输出稳定后的特征数据对应的特征集和阈预置对应的权值向量。
2.如权利要求1所述的方法,其特征在于,根据所述特征数据构建特征集,包括:
根据每一所述特征数据对特征数据总体熵的影响度,对提取到的所述特征数据进行筛选,通过筛选后的所述特征数据构建候选特征集。
3.如权利要求1所述的方法,其特征在于,获取到的用户行为数据包括:流量行为层数据、协议行为层数据、以及用户行为层数据。
4.如权利要求3所述的方法,其特征在于,根据所述特征数据构建特征集之前,还包括:
对提取到的所述特征数据进行归一化、区间对齐处理。
5.如权利要求1所述的方法,其特征在于,通过互信息评估所述基准特征数据的权值,包括:
通过互信息评估所述基准特征数据的特征相关性和特征冗余度;
根据所述特征相关性和所述特征冗余度得到所述基准特征的权值。
6.一种行为特征数据提取的装置,其特征在于,所述装置包括:
特征集模块,用于在获取到的用户行为数据中提取特征数据,根据所述特征数据构建特征集;
权值计算模块,用于在所述特征集中逐一选择一特征数据为基准特征数据,按照预设距离阈值将所述特征集中除基准特征数据以外的特征数据加权分割成邻域和远域,通过互信息评估所述基准特征数据的权值;
筛选模块,用于将所述权值反馈到所述基准特征数据对应的权值向量中,并在所述特征集中删除权值最小的特征数据;
特征数据输出模块,用于逐次删除权值最小的特征数据,在所述特征集对应特征数据的数目及所述权值向量稳定时,输出稳定后的特征数据对应的特征集和阈预置对应的权值向量。
7.如权利要求6所述的装置,其特征在于,所述特征集模块包括:
筛选单元,用于根据每一所述特征数据对特征数据总体熵的影响度,对提取到的所述特征数据进行筛选,通过筛选后的所述特征数据构建候选特征集。
8.如权利要求6所述的装置,其特征在于,获取到的用户行为数据包括:流量行为层数据、协议行为层数据、以及用户行为层数据。
9.如权利要求8所述的装置,其特征在于,所述特征集模块还包括:
特征数据整合单元,用于对提取到的所述特征数据进行归一化、区间对齐处理。
10.如权利要求1所述的装置,其特征在于,权值计算模块包括:
特性单元,用于通过互信息评估所述基准特征数据的特征相关性和特征冗余度;
权值单元,用于根据所述特征相关性和所述特征冗余度得到所述基准特征的权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司电子科学研究院,未经中国电子科技集团公司电子科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810576742.7/1.html,转载请声明来源钻瓜专利网。