[发明专利]一种电子证据分类提取方法及系统有效
申请号: | 201611120337.1 | 申请日: | 2016-12-08 |
公开(公告)号: | CN106650799B | 公开(公告)日: | 2019-05-31 |
发明(设计)人: | 高敏;江圣航;熊志海 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 白小清 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明申请一种电子证据分类提取方法及系统,涉及计算机信息处理分类技术领域,本发明基于内存分布式数据集RDD对提取的电子证据进行聚类处理,对聚类电子数据根据电子证据来源及类型进行分类并标引,电子证据分类器对获取的电子数据聚类,在经过模糊融合识别,获得分类电子证据;文档层处理模块,对目标数据进行文档化处理,呈述层模块对目标数据进行相关描述,自动生成描述型句子。本发明能够在多种数据来源,海量数据中快速准确提取出相关联的电子证据,并与案件进行关联,方便取证人员及办案人员能够快速准确的获取需要的相关电子证据。 | ||
搜索关键词: | 一种 电子 证据 分类 提取 方法 系统 | ||
【主权项】:
1.一种电子证据分类提取方法,其特征在于,包括步骤,电子证据获取模块调用RDD序列化存储函数读取电子数据,对电子数据进行归一化处理获得标称电子数据集构成测试集;分类训练模块将训练集中的样本数据转化为样本特征和标签,获得标引的电子证据样本集,该样本集中的所有样本数据获得标签,将获得标签的样本数据输入基分类器进行训练,获得电子证据分类器;将测试集中的电子数据输入电子证据分类器进行聚类,为测试集中每个电子数据寻找对应的标签,并分配到与其标签对应的内存分布式数据集RDD分区中,对每个RDD分区进行簇排序,即获得所有核心点的队列,得到不同层次结构上的簇号,合并分区,为每个分区保存一个标签,排除电子数据中的噪声信息,输出聚类结果;模糊融合识别模块对经过聚类到各RDD分区的电子数据进行模糊识别,获得分类电子证据;文档层处理模块从RDD各分区中拷贝分类电子证据形成目标数据,对目标数据进行文档化处理,送入呈述层模块,呈述层模块对目标数据进行相关描述,自动生成描述型句子。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611120337.1/,转载请声明来源钻瓜专利网。