[发明专利]案件分析数据处理方法、装置、设备和可读存储介质有效
申请号: | 201910795004.6 | 申请日: | 2019-08-26 |
公开(公告)号: | CN110532317B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 杨双全;刘畅;谢奕 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06F16/28 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 邓海鸿;杨瑾瑾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 案件 分析 数据处理 方法 装置 设备 可读 存储 介质 | ||
本发明实施例提出一种案件分析数据处理方法、装置、设备和可读存储介质,其中,方法包括:获取待分析案件集合中各个案件的原始数据;根据所述各个案件的原始数据,确定所述各个案件的各项特征信息;根据所述各个案件的各项特征信息和预设的特征信息连边规则,确定所述待分析案件集合的图数据;获取频繁子图的度量值;根据所述度量值和预定的频繁子图挖掘算法,确定所述待分析案件集合的图数据中的频繁子图数据。基于频繁子图的数据,有利于同时从多个维度分析案件的规律和趋势,使得分析结果更加全面。
技术领域
本发明涉及计算机技术领域,尤其涉及一种案件分析数据处理方法、装置、设备和可读存储介质。
背景技术
随着社会发展,各种违法犯罪行为层出不穷,作案手段,方式,作案群体和受害人群体也日趋多元化;在此背景下,挖掘犯罪活动规律和犯罪趋势成为一个难题。目前业内主要的分析方式是传统的统计案件信息,然后将统计信息汇总。在统计的过程中,可能会从多个角度去统计,或者,将某一类型的案件信息筛选出来,做专项统计。使用传统的统计方法,无法同时从多个维度分析案件发生规律和趋势,分析结果较为片面。
发明内容
本发明实施例提供一种案件分析数据处理方法、装置、设备和可读存储介质,以至少解决现有技术中的以上技术问题。
第一方面,本发明实施例提供了一种案件分析数据处理方法,包括:
获取待分析案件集合中各个案件的原始数据;
根据所述各个案件的原始数据,确定所述各个案件的各项特征信息;
根据所述各个案件的各项特征信息和预设的特征信息连边规则,确定所述待分析案件集合的图数据;
获取频繁子图的度量值;
根据所述度量值和预定的频繁子图挖掘算法,确定所述待分析案件集合的图数据中的频繁子图数据。
在一种实施方式中,所述根据所述各个案件的原始数据,确定所述各个案件的各项特征信息,包括:
根据预设的特征信息项目,从所述各个案件的原始数据中提取对应的各项初始特征信息;
对所述各项初始特征信息进行归一化处理,得到所述各个案件的各项特征信息。
在一种实施方式中,所述根据所述各个案件的各项特征信息和预设的特征信息连边规则,确定所述待分析案件集合的图数据,包括:
对于所述各个案件,根据对应的所述各项特征信息,确定多个顶点,并,根据所述预设的特征信息连边规则,确定所述多个顶点的连边;
根据所述多个顶点和所述连边,确定所述各个案件的单图数据;
利用所述各个案件的单图数据中特征信息值相同的所述顶点,连接所述各个案件的单图数据,得到所述待分析案件集合的图数据。
在一种实施方式中,所述根据所述各个案件的各项特征信息和预设的特征信息连边规则,确定所述待分析案件集合的图数据,包括:
对于所述各个案件,根据对应的所述各项特征信息,确定多个顶点,并,根据预设的特征信息连边规则,确定所述多个顶点的连边;
根据所述多个顶点和所述连边,确定所述各个案件的单图数据,将所述各个案件的单图数据的集合作为所述待分析案件集合的图数据。
在一种实施方式中,还包括:
在接收到对指定特征信息的子图生成指令的情况下,在所述待分析案件集合的图数据中,确定所述指定特征信息对应的第一顶点,以及所述第一顶点连接的各个顶点;
根据所述第一顶点以及所述第一顶点连接的各个顶点,生成所述指定特征信息的子图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910795004.6/2.html,转载请声明来源钻瓜专利网。