[发明专利]基于数据对犯罪行为的多维度分析方法在审
申请号: | 201811450130.X | 申请日: | 2018-11-30 |
公开(公告)号: | CN109558488A | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 田峰 | 申请(专利权)人: | 重庆市千将软件有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 408000 重庆市涪陵区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 正则表达式 数据筛选模块 多维度分析 成员关系 犯罪行为 数据库 数据采集模块 上下文数据 手机存储卡 相似度分析 用户关联度 通信记录 通讯记录 账号信息 遍历 图谱 保存 证据 | ||
基于数据对犯罪行为的多维度分析方法,采用以下步骤,S1:数据采集模块对手机存储卡上的所有数据进行提取,保存到数据库中;S2:设置有正则表达式,数据筛选模块按照正则表达式对信息数据表中符合正则表达式的信息进行提取,该正则表达式对应通讯记录和账号信息;S3:数据筛选模块通过关键词对数据库中的数据进行遍历,将关键词对应的上下文数据提取到证据库中,设置的相似度分析模块能够针对通信记录成员关系建立用户关联度图谱,有效的表明交互成员关系的远近。
技术领域
本发明涉及数据分析领域,具体涉及基于数据对犯罪行为的多维度分析方法。
背景技术
随着网络和移动设备的发展,用户越来越多的通过移动设备来进行上网和数据交互,在手机中存储了大量的数据,各种各样的行为数据交织在一起,在当前的手机取证中,采用传统方式对数据方式进行分析,主要功能为罗列展示手机中的原始数据,包括但不限于通讯录、短信、通话、即时通讯、邮件、浏览记录等等诸多信息,没有进一步的挖掘分析。工作人员需要通过自己人工数据查看,才能对机主有一个总体了解。
一方面是数据量巨大,光是各种浏览历史记录和通讯记录的关系都很难理清,同时,对工作人员来说也是很繁琐的差事,并且有一些数据的关联性很难发现。因此,为了解决上述问题,需要提供一种新的数据分析方法。
发明内容
本发明针对现有技术的不足,提出基于数据对犯罪行为的多维度分析方法,具体技术方案如下:基于数据对犯罪行为的多维度分析方法,其特征在于:
采用以下步骤,
S1:数据采集模块对手机存储卡上的所有数据进行提取,保存到数据库中;
S2:设置有正则表达式,数据筛选模块按照正则表达式对信息数据表中符合正则表达式的信息进行提取,该正则表达式对应通讯记录和账号信息;
S3:数据筛选模块通过关键词对数据库中的数据进行遍历,将关键词对应的上下文数据提取到证据库中;
S4:相似度分析模块针对通信记录中与每个成员的通话频率,建立社交关系亲密度的列表;
S5:数据采集模块导出社交软件中的聊天记录到训练数据库;
S6:预处理模块对训练数据库中的数据进行数据清洗,得到该账号对应的聊天数据;
S7:分词模块对聊天数据按照语义进行单词划分处理后,得到输入数据;
S8:将该输入数据输送到神经网络模型中,神经网络模型对输入数据进行分类,该神经网络模型对输入数据进行分类识别,将分类识别的数据保存在结果数据库中;
S9:统计模块对结果数据库中的数据进行统计,得到用户的话语行为特征。
进一步地:所述账号信息包括微信账号和QQ账号。
进一步地:所述S2中,所述相似度分析模块采用的分析方法为Minkowskwi距离算法。
本发明的有益效果为:第一,设置的相似度分析模块能够针对通信记录成员关系建立用户关联度图谱,有效的表明交互成员关系的远近。
第二,设置的神经网络模型能够对用户的聊天记录进行分类,通过神经网络模型的数据分类后,能够清楚的建立用户的话语行为特征。
第三,通过各种模块的相互作用,有效减少了取证人员的劳动。
附图说明
图1为本发明的工作流程图。
具体实施方式
下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆市千将软件有限公司,未经重庆市千将软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811450130.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于层次性多注意力网络的文档分类方法
- 下一篇:文本分类方法及装置