[发明专利]一种基于深度神经网络的建设工程合同纠纷法条识别方法在审
| 申请号: | 202210853595.X | 申请日: | 2022-07-11 |
| 公开(公告)号: | CN115017319A | 公开(公告)日: | 2022-09-06 |
| 发明(设计)人: | 李建平;张龙;杨淑琪;孙康然;刘嘉宇 | 申请(专利权)人: | 鹤壁职业技术学院 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06N3/04;G06Q50/18 |
| 代理公司: | 青海中赢知识产权代理事务所(普通合伙) 63104 | 代理人: | 高清峰 |
| 地址: | 458031 *** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 神经网络 建设 工程 合同纠纷 法条 识别 方法 | ||
1.一种基于深度神经网络的建设工程合同纠纷法条识别方法,其特征在于:包括以下步骤:
S1、建立法条库,逐个读取裁判文书库中的裁判文书,采用正则表达式提取裁判依据中出现的法律条文和司法解释条文,每个裁判文书涉及到法条至少有一条,将每个裁判文书涉及到的法条放入法条库,去重后,对法条进行编号,法条库可以是字典的数据格式,每个法条及其编号表现为一个键值对;
S2、建立判例数据库,将法条名称与法条库中的键值对匹配后,得到法条编号,对法条进行多热法编码;
S3、对裁判文书中的案情进行分词,采用word2vec预训练词向量模型实现词嵌入,整个文档可以转换为一个二维张量,每个裁判文书文档的二维张量及对应的表示法条的多热编码向量构成了一条训练数据;
S4、全部裁判文书生成多个训练数据,这些训练数据构成了判例数据库,将判例数据库中的数据划分为训练集合和测试集合;
S5、训练并并测试文本分类模型,将判例数据库中训练数据集合用于训练文本分类模型,并使用测试数据集合测试文本分类模型的性能;
采用Hamming Loss指标判断文本分类模型在多标签多分类任务中的性能:
式中,是实际张量;表示模型输出张量;表示样本个数;表示标签数;为指示函数,当完全等同于时,值为1,否则,值为0;
Hamming Loss取值在0-1之间,值越小,模型性能越好;
S6、待决案的法条识别,将待决案案情分词,采用word2vec预训练词向量模型实现词嵌入,将案情词向量输入训练好的法条识别模型,即可得到多热向量,根据多热向量中值为1的元素的位置下标,即可得到法条编码,采用法条编码在法条库中查找,即可得到待决案涉及到的法条。
2.根据权利要求1所述的一种基于深度神经网络的建设工程合同纠纷法条识别方法,其特征在于:所述S1步骤和S2步骤中读取裁判文书库中的裁判文书需要进行法条识别,法条识别采用长短记忆神经网络(LSTM)实现多标签多分类,法条识别模型的输入是词向量,输出是用多热法表示的法条编码。
3.根据权利要求1所述的一种基于深度神经网络的建设工程合同纠纷法条识别方法,其特征在于:S1步骤所述裁判文书库为建设工程合同纠纷的裁判文书,所述裁判文书库的容量大于五万条。
4.根据权利要求1所述的一种基于深度神经网络的建设工程合同纠纷法条识别方法,其特征在于:S2步骤所述多热编码向量共有个元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鹤壁职业技术学院,未经鹤壁职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210853595.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:测试喇叭的装置、系统及方法
- 下一篇:一种高纯一氧化碳电子气体的制备纯化方法





