[发明专利]一种基于多任务人工神经网络的刑期预测方法有效

专利信息
申请号: 201811441634.5 申请日: 2018-11-29
公开(公告)号: CN109376227B 公开(公告)日: 2019-08-13
发明(设计)人: 李玉军;冀先朋;马浩洋;韩均雷 申请(专利权)人: 山东大学
主分类号: G06F16/332 分类号: G06F16/332;G06F16/35;G06N3/04;G06Q50/18
代理公司: 济南金迪知识产权代理有限公司 37219 代理人: 杨树云
地址: 250199 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 预测 裁判 人工神经网络 神经网络模型 预处理 法律条文 犯罪事实 分类处理 基本信息 全面利用 数据分析 文书数据 多维度 关注点 准确率 引用 挖掘 伤害 支撑 法律
【权利要求书】:

1.一种基于多任务人工神经网络刑期预测方法,其特征在于,包括步骤如下:

(1)对原始数据进行预处理:

抽取所需信息,实现数据结构化,构造结构化数据集;

(2)训练阶段:

把结构化数据集随机分为两部分,比例为8:2,大的部分数据集打乱后分成N份,每次取N-1份做训练,1份做验证,做N次交叉验证,评估模型性能,小的部分作为测试数据集;获得当前训练阶段所需要的训练数据,将训练数据依次进行分词处理、词向量映射后,输入模型,获得输出;

所述模型包括词向量嵌入层、双向LSTM层、最大池化层、注意力机制层、平均池化层、分类器、计算损失层、更新参数层;所述词向量嵌入层、所述双向LSTM层、所述最大池化层依次连接;所述双向LSTM层、所述注意力机制层、所述平均池化层依次连接;所述分类器包括罪名分类器、法律属性分类器、刑期回归预测器,所述罪名分类器、所述法律属性分类器、所述刑期回归预测器都是二分类;所述最大池化层、所述计算损失层、所述更新参数层依次连接;所述双向LSTM层、所述注意力机制层、所述法律属性分类器、所述计算损失层、所述更新参数层依次连接;所述最大池化层、所述平均池化层均连接所述刑期回归预测器,所述刑期回归预测、所述计算损失层、所述更新参数层依次连接;所述罪名分类器为M分类,M罪名类型的数量;所述法律属性分类器有18个;包括步骤如下:

A、所述词向量嵌入层将样本从原始数据转换为词向量;

B、所述双向LSTM层以词向量为输入,将词向量转换为具有某种语义的特征,输出固定长度的特征向量;

C、所述最大池化层以双向LSTM层输出的特征向量为输入,提取主要特征,输出一维向量;

D、所述注意力机制层以双向LSTM层输出的特征向量为输入,从特征向量中根据不同的任务提取出不同的信息,输出为每个任务一个一维向量,即法律属性的特征向量;

E、所述平均池化层将所述注意力机制层的输出的多个一维向量合并为一个矩阵,并计算成一个一维向量;

F、所述计算损失层将所述最大池化层的输出与所述平均池化层的输出拼接为一个一维向量,该一维向量经过两层神经网络转化为长度和数据标签一样形式的数据,对于预测罪名和法律属性的分类任务,采用交叉熵形式分类误差,计算输出与目标的误差;对于刑期回归任务,采用均方差形式进行计算误差,计算目标与实际刑期之间的均方误差;将所有误差累计,称之为总损失;

G、所述罪名分类器将所述最大池化层的输出与所述平均池化层的输出拼接成的一个一维向量,变为一个267长度的向量,归一化处理后,数值最大的对应位置上的罪名类型即为本条数据预测的罪名;

H、所述法律属性分类器将所述注意力机制层的输出向量变为一个2长度的向量,归一化处理后,数值最大的对应位置上的法律属性型即为本条数据预测的法律属性,即第一个位置的数字大,代表该属性为是,第二个位置的数据大,代表该属性为否;

I、所述刑期回归预测器将所述最大池化层的输出与所述平均池化层的输出拼接成的一个一维向量,再加上嫌疑人基本信息,变为一个数字,该数字即是对该条数据刑期的预测;嫌疑人基本信息为一维,长度为3,包括年龄、性别,是否有前科;

J、所述更新参数层采用反向传播原理,计算输出目标对各个参数节点的梯度,每一层的梯度都是间接由上一层的梯度求出,根据梯度下降的方向更新参数,参数是指上述各层中的参数,包括所述词向量嵌入层的词向量、所述双向LSTM层的参数、所述注意力机制层的参数、所述罪名分类器的参数、所述法律属性分类器的参数和所述刑期回归预测器的参数,直到达到预设的迭代次数,将误差最小的模型保存至本地;

(3)测试阶段:

加载训练阶段中保存的模型,对测试数据集进行采样,获得测试所用数据,将测试所用数据输入模型,依次进行分词、词向量映射、神经网络前向传播计算,输出刑期预测值,显示预测刑期,并与实际刑期进行比对,评估模型性能。

2.根据权利要求1所述的一种基于多任务人工神经网络刑期预测方法,其特征在于,所述步骤(2)中,对于预测罪名和中间属性的分类任务,采用交叉熵形式分类误差,计算输出与目标的误差;交叉熵计算公式如式(Ⅰ)所示:

式(Ⅰ)中,y′i为标签中的第i个值,yi为对应的预测分量,Hy'(y)是指交叉熵。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811441634.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top