[发明专利]基于多任务学习的刑事案件判决预测方法、系统及介质有效
申请号: | 202110454069.1 | 申请日: | 2021-04-26 |
公开(公告)号: | CN113065347B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 张月国;黄熙宇;董莉莉 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/30;G06F40/14;G06F40/126;G06F40/253;G06Q50/18;G06N3/04;G06N3/08 |
代理公司: | 上海段和段律师事务所 31334 | 代理人: | 李佳俊;郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 任务 学习 刑事案件 判决 预测 方法 系统 介质 | ||
1.一种基于多任务学习的刑事案件判决预测方法,其特征在于,包括:
步骤S1:获取案情文本原始数据,并对案情文本原始数据进行预处理,得到预处理后的案情文本;
步骤S2:将预处理后的案情文本进行分词,得到预处理后的分词案情文本;
步骤S3:预处理后的分词案情文本进行one-hot编码,得到词编码,然后再进行word2vec的编码,得到全文的词向量;
步骤S4:基于预处理后的分词案情文本构建语法树,并将语法树中预设要求词对关系的词对抽取出来,对抽取出的词对进行one-hot编码及word2vec的编码,得到词对的词向量;
步骤S5:构建案件预测模型并对案件预测模型进行训练,得到训练后的案件预测模型;
步骤S6:将全文的词向量和词对的词向量输入训练后的案件预测模型,得到相关法条、罪行以及刑期的预测结果;
所述步骤S5中案件预测模型包括:深度学习网络模型,包括:TextCNN网络单元、法律条款预测单元、罪名预测单元、LSTM刑期预测单元和反向预测单元;
所述TextCNN网络单元将全文词向量按照先后顺序排列成矩阵,通过TextCNN网络抽取出全文的语义信息的特征向量;
所述法律条款预测单元通过深度学习网络模型的线性层对TextCNN网络单元提取的特征向量进行法律条款的预测;
所述罪名预测单元通过深度学习网络模型的线性层对TextCNN网络单元提取的特征向量进行罪名的预测;
所述LSTM刑期预测单元将词对关系的词向量按照先后顺序排列成矩阵,然后将矩阵输入深度学习的自注意力层,得出结果再输入到深度学习网络的LSTM网络得到特征向量;将得到的特征向量、法律条款的预测、罪名的预测输入深度学习网络模型的线性层,进行刑期的预测;
所述反向预测单元是将所有的预测结果与真实标签进行比较,将交叉熵作为损失函数,利用损失函数的结果对深度学习网络模型的参数进行修正。
2.根据权利要求1所述的基于多任务学习的刑事案件判决预测方法,其特征在于,所述步骤S1包括:对案情文本原始数据进行去噪处理,得到去噪后的案情文本。
3.根据权利要求1所述的基于多任务学习的刑事案件判决预测方法,其特征在于,所述TextCNN网络单元包括:将全文词向量按照先后顺序排列成矩阵,通过深度学习网络模型的卷积网络层、池化层、全连接层和softmax层取出全文的语义信息的特征向量。
4.根据权利要求1所述的基于多任务学习的刑事案件判决预测方法,其特征在于,所述步骤S6包括:
步骤S6.1:将案情描述的词向量输入案件预测模型的TextCNN网络单元,TextCNN网络单元对词向量利用多个滤波器进行特征提取;
步骤S6.2:将提取特征输入案件预测模型的法律条款预测单元得到法律条款预测结果;
步骤S6.3:将提取特征和法律条款预测结果输入案件预测模型的罪名预测单元得到罪名预测结果;
步骤S6.4:将词对的词向量、法律条款预测结果、罪名预测结果输入案件预测模型的LSTM刑期预测单元得到最终刑期长短预测结果;
步骤S6.5:将法律条款预测结果、罪名预测结果、最终刑期长短预测结果输入案件预测模型的反向预测单元进行预测结果的校验、融合及参数优化,得到最终法律条款预测结果和最终罪名预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110454069.1/1.html,转载请声明来源钻瓜专利网。