[发明专利]一种基于贝叶斯网络的裁判文书分类方法有效
申请号: | 201911385776.9 | 申请日: | 2019-12-29 |
公开(公告)号: | CN111597331B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 吕建华;应镕嵘;张柏礼 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06Q50/18;G06N5/04;G06N7/01 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 薛雨妍 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 贝叶斯 网络 裁判 文书 分类 方法 | ||
1.基于贝叶斯网络的裁判文书分类方法,其特征在于,包括以下步骤:
(1)提取基本法律要素,先对裁判文书进行分段操作,之后经过分词,停用词去除操作得到候选法律要素;接着对候选法律要素进行权重的计算,以衡量其对裁判文书主题的表现能力,并根据权重大小提取法律要素;
(2)构建法律要素关系网络;
(3)提取关联特征;
(4)构建裁判文书贝叶斯网络;
(5)构建联合树推理模型,进行推理分类;
所述步骤(2)中,法律要素关系网络的构建过程是先将预处理过后的裁判文书按照句子划分,对于每个句子,设置固定的滑动窗口,同时出现在同一个窗口的法律要素之间存在一条边,法律要素在原文中出现的顺序即为边的方向;
所述步骤(3)中,关联特征的提取是在法律要素关系网络的基础上,使用NetworkEmbedding方法得到,其过程为:在网络中选取中心节点,从中心节点出发进行游走,得到固定长度的游走序列,将节点类比成词项,节点序列类比成句子,之后放到Word Embedding的Skip-gram模型中训练,得到节点的向量表示;
所述步骤(4)中,裁判文书贝叶斯网络的构建分为结构学习和参数学习两个部分;结构学习的过程分为四步:首先基于构建的法律要素关系网络进行贝叶斯网络的初始化,得到一个单连通的无向图,此时图中结点之间关系仅有在原文中的共现关系;第二阶段根据由Network Embedding得到的关联特征对第一阶段的单连通图进行增厚,丰富节点之间的关系,得到无向图S;第三阶段在保证无向图S连通的前提下,基于贪婪搜索的思想对冗余边进行去除;最后,将边权重作为网络的结构评分标准,进行边定向操作,确定最优结构;
所述步骤(5)中联合树推理模型的构造包括道义化,三角化,联合树构造三个步骤;道义化的过程为先连接入度大于1的节点的父节点,之后将所有有向边转化为无向边,得到道义图;三角化的过程为遍历网络中的所有节点,检验节点与其所连接的节点是否构成长度为3的环,如果不构成,检验其是否存在边,如果不存在,则添加边将其连接,得到有弦图;联合树构造的过程为将有弦图中的每个“三角”作为联合树的节点,三角之间重合的点和边即为联合树的边,得到联合树。
2.根据权利要求1所述的基于贝叶斯网络的裁判文书分类方法,其特征在于:所述的裁判文书分段操作,按照“原告陈诉”、“被告辩诉”、“审理查明”、“本院认为”、“判决结果”五个关键词将裁判文书分为五个内容模块。
3.根据权利要求2所述的基于贝叶斯网络的裁判文书分类方法,其特征在于:所述的法律要素权重计算采用基于平均信息熵的法律要素主题表现力评估方法,综合考虑平均信息熵、位置特征和词频特征三大标准进行计算。
4.根据权利要求1所述的贝叶斯网络的裁判文书分类方法,其特征在于:参数学习需要在结构学习得到的网络结构基础上进行,参数学习的过程是通过统计法律要素在文档集中出现的频率,学习各个节点的概率分布表。
5.根据权利要求1所述的贝叶斯网络的裁判文书分类方法,其特征在于,所述步骤(5)中联合树推理的过程为给定的节点信息,在联合树模型上根据贝叶斯理论对裁判文书所涉案由进行推理,得到分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911385776.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:液晶显示装置以及图像信号修正方法
- 下一篇:同轴电缆