[发明专利]一种刑事法律文书罪名的推荐方法和系统在审

专利信息
申请号: 202010236444.0 申请日: 2020-03-30
公开(公告)号: CN111460100A 公开(公告)日: 2020-07-28
发明(设计)人: 李芳芳;陈可道;张健 申请(专利权)人: 中南大学
主分类号: G06F16/33 分类号: G06F16/33;G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06Q50/18
代理公司: 北京高沃律师事务所 11569 代理人: 刘凤玲
地址: 410083 湖南*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 刑事 法律文书 罪名 推荐 方法 系统
【说明书】:

发明涉及一种刑事法律文书罪名的推荐方法和系统。该方法包括:获取刑事法律文书,并对所述刑事法律文书进行分词处理得到以词条为单位的文本集合;获取word2vec词向量模型和文本可分离卷积神经网络模型;以所述word2vec词向量模型为嵌入层,结合所述文本可分离卷积神经网络模型构建罪名推荐模型;利用所述罪名推荐模型,根据所述文本集合得到罪名标签矩阵,进而根据所述罪名标签矩阵确定与所述刑事法律文书相对应的罪名。本发明提供的刑事法律文书罪名的推荐方法和系统,具有人力成本低、罪名获取效率高和推荐罪名精确度高等特点。

技术领域

本发明涉及文本处理技术领域,特别是涉及一种刑事法律文书罪名的推荐方法和系统。

背景技术

根据刑事法律文书的案情描述与事实预测罪名是指根据描述刑事案件的一段具体文本,来预测该刑事案件中犯人被提起刑事诉讼时应当对应的罪名。

根据刑事法律文书判定罪名有下列方法:

纯人工判断,一般是专业人士根据相关知识人为的判别罪名,是比较原始的方法。该方法需要富有刑法知识和经验的人力,其准确性也取决于人员的专业程度,还需要花费大量时间,效率较低。

基于关键词语匹配的自动预测方法,通过收集自定义一个对应不同类型罪名的词典,通过将每一案例的文本与自定义字典做关键词匹配来确定其对应的罪名。该方法速度快,但精度非常低,并且需要大量的先验知识构建匹配词语词典,人力成本较高。

基于机器学习模型的分类算法,例如支持向量机、随机森林等,这一类方法主要是根据观察心事法律文书案情描述与事实文本特征,然后通过人工提取构建这些特征再将其作为输入,利用机器学习算法来得到关于罪名的分类结果。这些算法在面对多标签多分类问题时有精度不高,训练耗时长的不足,并且需要大量先验知识来人工构建复杂的特征。

基于序列模型或循环神经网络的深度学习算法,包括LSTM(Long Short-TermMemory,长短期记忆网络)、RNN(Recurrent Neural Network,循环神经网络)等。通常的基于序列模型或循环神经网络的深度学习算法不需要人工构建特征,但是对于原始训练数据要求很高,比如在面对非常不平衡的刑事法律文书数据时,对于出现次数很多的罪名类别可以非常好的拟合,但却无法拟合出现次数很少的罪名类别。此外,单独使用上述深度学习模型还不足以很好的获取刑事法律文书案情描述和事实文本的语义信息,往往需要与能提取原始文本语义信息的输入相结合才会有更好的精度效果,并且,这类方法因为网络结构复杂导致其具有训练耗时长的缺点。

因此,提供一种具有人力成本低、罪名获取效率高的刑事法律文书罪名的推荐方法,是本领域亟待解决的技术难题。

发明内容

本发明的目的是提供一种具有人力成本低、罪名获取效率高的刑事法律文书罪名的推荐方法和系统。

为实现上述目的,本发明提供了如下方案:

一种刑事法律文书罪名的推荐方法,包括:

获取刑事法律文书,并对所述刑事法律文书进行分词处理得到以词条为单位的文本集合;

获取word2vec词向量模型和文本可分离卷积神经网络模型;

以所述word2vec词向量模型为嵌入层,结合所述文本可分离卷积神经网络模型构建罪名推荐模型;

利用所述罪名推荐模型,根据所述文本集合得到罪名标签矩阵,进而根据所述罪名标签矩阵确定与所述刑事法律文书相对应的罪名。

优选的,所述获取刑事法律文书,并对所述刑事法律文书进行分词处理得到以词条为单位的文本集合之后还包括:

对所述文本集合进行预处理;所述预处理包括:去除停用词和标点符号。

优选的,所述推荐方法还包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010236444.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top