[发明专利]数据处理方法及系统及装置及介质及数据分析方法有效
申请号: | 202110582834.8 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113282726B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 翁洋;李鑫;王竹;其他发明人请求不公开姓名 | 申请(专利权)人: | 成都数之联科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/36;G06F40/279;G06N3/04;G06N3/08 |
代理公司: | 成都云纵知识产权代理事务所(普通合伙) 51316 | 代理人: | 熊曦;陈婉鹃 |
地址: | 610042 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 系统 装置 介质 数据 分析 | ||
本发明公开了数据处理方法及系统及装置及介质及数据分析方法,涉及自然语言处理领域,包括:从裁判文书库中筛选出包含预设类型犯罪的裁判文书数据;提取所述裁判文书数据信息中的案情事实数据;建立图神经网络,将所述案情事实数据输入所述图神经网络;在所述图神经网络的节点位置抽取实体信息数据、实体间的关系数据和事件序列信息数据,并转换为结果数据输出,所述结果数据包括(实体1,关系,实体2)三元组和裁判文书所属的犯罪类型;本发明得到的分析统计结果是基于裁判文书库中预设犯罪类型的全量裁判文书数据;通过深度学习的方法进行启发式的信息抽取,使得统计的维度更全面,不易受人为干扰。
技术领域
本发明涉及自然语言处理领域,具体地,涉及数据处理方法及系统及装置及介质及数据分析方法。
背景技术
近年来,犯罪现象明显增多、犯罪类型呈多样化发展趋势。随着我国社会发展的不断进步,司法有对犯罪的种类以及多样性的发展趋势进行进一步分析研究的需求。要满足这些需求,对以往的裁判文书的分析统计尤为重要,对以往涉案案情的分析也很重要。
从已有的裁判文书库中收集历年的涉及某类型犯罪的裁判文书,然后使用深度学习的方法抽取收集的裁判文书中的信息然后统计。目前业内(包含法院)对这些研究统计性质的问题,都是采用抽样的方法筛选出部分裁判文书,然后使用人工统计和分析其中的部分维度,然后出具相应的分析报告。这样做的缺点在于:1、抽样出来的样本是极少数的,容易发生样本偏差和幸存者原理的错误结论;2、统计的维度容易受到个别裁判文书和统计人员的主观干扰,导致得到片面的结论。3、样本量太少,没有对其他维度的统计,如跨时间概念和区域概念统计,导致了不能有效判断该类型犯罪的在预设维度内的发展趋势和情况。
发明内容
为了解决上述问题,本发明提供了数据处理方法及系统及装置及介质及数据分析方法,本发明得到的信息抽取结果是基于裁判文书库中所有涉及相应犯罪的案件,使用全量样本数据能够保证抽取信息的完整性。利用深度学习的方法进行启发式的信息抽取,使得统计的维度更加的全面,不易受人为干扰,同时全量的裁判文书能够从预设维度分析相应犯罪案件的发展趋势和情况。
为实现上述发明目的,本发明提供了一种基于裁判文书的信息的数据处理方法,其包括步骤:
从裁判文书库中筛选出包含预设类型犯罪的裁判文书数据;
提取所述裁判文书数据信息中的案情事实数据;
建立图神经网络,将所述案情事实数据输入所述图神经网络;
在所述图神经网络的节点位置抽取实体信息数据、实体间的关系数据和事件序列信息数据,并转换为结果数据输出,所述结果数据包括(实体1,关系,实体2)三元组和裁判文书所属的犯罪类型。
优选的,所述方法还包括:从所述案情事实数据中提取出关键词,所述结果数据还包括所述关键词。结果数据中包括关键词,通过关键词用户能够快速获知对应裁判文书的关键信息,方便用户快速高效的了解该裁判文书。
其中,本方法在所述图神经网络的节点位置抽取地名、毒品数量、贩毒人数、贩毒关系和贩毒事件信息数据。本方法使用的实体识别和关系抽取以及事件抽取的联合学习模型UBCRE,进行地名,毒品数量,贩毒人数,贩毒关系,贩毒事件等具体信息进行抽取,上述抽取的数据能够准确的反映出毒品这个特殊犯罪领域的特征,通过上述方式能够准确的从裁判文书中提取出毒品犯罪的特征信息,进而能够准确的获得毒品犯罪的在发展趋势和情况,对于毒品案件裁判文书的处理具有良好的效果。
本发明还提供了一种基于裁判文书的信息的数据分析方法,包括步骤:
根据所述的数据处理方法;
根据所述结果数据进行预设维度统计与犯罪信息分析。利用结果数据,本方法可以从相关维度对犯罪信息进行统计与分析,如犯罪的时间、地域等等,便于对犯罪的发展情况进行研究。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数之联科技股份有限公司,未经成都数之联科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110582834.8/2.html,转载请声明来源钻瓜专利网。