[发明专利]一种电子设备的数据取证方法、存储介质及终端有效
申请号: | 202110304911.3 | 申请日: | 2021-03-17 |
公开(公告)号: | CN113011503B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 彭黎文 | 申请(专利权)人: | 彭黎文 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/289;G06F40/30;G06N3/04;G06N3/08;G06N20/20 |
代理公司: | 成都华风专利事务所(普通合伙) 51223 | 代理人: | 张巨箭 |
地址: | 646000 四川省泸州*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子设备 数据 取证 方法 存储 介质 终端 | ||
本发明公开了一种电子设备的数据取证方法、存储介质及终端,属于数据分类技术领域,采集电子设备的目标数据信息;计算目标数据信息的特征向量,构建训练集;对训练集进行聚类处理,得到多个聚类子样本集;基于不同的聚类样本集构建多个对应的分类模型,并通过训练集对分类模型进行训练,获得不同分类模型的分类性能;将分类性能排名靠前的多个分类模型构成的分类器组合进行差异度计算,选择差异度最大的一组分类器构成集成学习模型;对训练集成学习模型进行训练,并将完成训练的集成学习模型用作对目标数据信息的分类,模型分类精度高,泛化能力强,适用范围广。
技术领域
本发明涉及数据分类技术领域,尤其涉及一种电子设备的数据取证方法、存储介质及终端。
背景技术
据工业和信息化部无线电管理局正式发布的《中国无线电管理年度报告》统计数据显示,2018年我国净增移动电话用户达到1.49亿户,总数达到15.7亿户。到目前为止,用户数量还在呈现上升趋势。随着智能手机的普及,手机的基础功能短信息也得到了更加广泛的应用,是人们之间通信交流的重要手段。与此同时,以手机为介质的违法犯罪活动也日益猖獗,此类犯罪活动会严重损害国家和个人的利益,影响社会的和谐与稳定。智能手机作为一种重要的通信交流工具,里面直接记录了犯罪人员犯罪活动的证据,如利用短信息或电话诈骗,散播谣言等,这就需要执法人员仔细对手机中存储的短信息进行分析取证,从而有效打击此类犯罪活动。
随着手机软硬件技术的不断发展,手机的内存存储量不断增大,手机中的短信息存储量也是越来越大,案件中往往会涉及到众多人员,因此需要执法人员同时分析很多部手机,使得分析的数据量非常巨大。为了解决该问题,出现了一些基于数据挖掘、机器学习技术的取证分析方法,通过直接对收集到的所有数据信息进行自动分类,从而智能的帮助执法人员排查电子证据。上述分类方法在取证分析过程中,存在短信息数据样本不平衡、数据集噪声大的问题,且传统单一自动分类方法泛化误差较高,对于分布不平衡数据分类性能不理想,无法有效的辅助警务执法人员对电子证据进行分析与排查。
发明内容
本发明的目的在于针对现有取证实际中,短信息数据样本不平衡,数据集噪声大,单一分类方法泛化误差较高,且处理分布不平衡数据达不到较好性能等问题,提出了一种智能手机数据取证方法、存储介质及终端。
本发明的目的是通过以下技术方案来实现的:一种电子设备的数据取证方法,所述方法包括:
采集电子设备的目标数据信息;
计算目标数据信息的特征向量,构建训练集;
对训练集进行聚类处理,得到多个聚类子样本集;
基于不同的聚类样本集构建多个对应的分类模型,并通过训练集对分类模型进行训练,获得不同分类模型的分类性能;
将分类性能排名靠前的多个分类模型构成的分类器组合进行差异度计算,选择差异度最大的一组分类器构成集成学习模型;
对训练集成学习模型进行训练,并将完成训练的集成学习模型用作对目标数据信息的分类。
作为一选项,所述方法还包括预处理步骤:将采集电子设备的目标数据信息进行分词处理,去除停用词。
作为一选项,所述计算目标数据信息的特征向量步骤后还包括:计算目标数据信息的特征权重,进行特征选择更新训练集。
作为一选项,所述计算目标数据信息的特征权重Wi的计算公式为:
Wi=WT×WI
其中,WT为某一特征项在文本中的频率,WI表示特征项的逆向频率;
进行特征选择的计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于彭黎文,未经彭黎文许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110304911.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种矿用镍氢电池充放电控制的方法
- 下一篇:一种基于物联网电力的智能配电柜
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置