[发明专利]一种裁判文书结构化处理方法及系统有效

专利信息
申请号: 201910893066.0 申请日: 2019-09-20
公开(公告)号: CN110750974B 公开(公告)日: 2023-04-25
发明(设计)人: 请求不公布姓名 申请(专利权)人: 成都星云律例科技有限责任公司
主分类号: G06F40/186 分类号: G06F40/186;G06Q50/18
代理公司: 成都行之专利代理事务所(普通合伙) 51220 代理人: 熊曦
地址: 610000 四川省成都市高新*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种裁判文书结构化处理方法及系统,所述方法包括:建立裁判文书语料库;分析裁判文书结构;标注裁判文书,将标注的裁判文书划分为训练集和验证集;构建语言模型并预训练;计算预训练语言模型的损失函数;将训练集输入预训练语言模型,输出训练集中裁判文书的向量表示;利用该向量及训练集标注数据训练预测分段模型,获得初步的预测分段模型;将验证集输入预训练语言模型,将输出的向量输入初步预测分段模型,对比输出的分段结果与裁判文书标注调整优化预测分段模型,得到最优预测分段模型;利用本发明可提升裁判文书结构化处理准确率,降低对人工核查的依赖,提升裁判文书结构化处理效率。
搜索关键词: 一种 裁判 文书 结构 处理 方法 系统
【主权项】:
1.一种裁判文书结构化处理方法,其特征在于,所述方法包括:/n收集历史裁判文书,建立裁判文书语料库;/n分析裁判文书结构,将裁判文书分为若干部分,每个部分对应一个标签;/n将裁判文书语料库中的每篇裁判文书按照自然段分隔为多个段落;/n从裁判文书语料库中提取部分裁判文书,将每篇裁判文书的每个段落打上裁判文书结构标签之一,作为标注数据;/n将标注数据划分为训练集和验证集;/n构建语言模型,预训练语言模型,包括:给定每个单词初始的向量表示,使用两个预测任务训练语言模型,在语言模型训练过程中更新单词向量,得到预训练语言模型;/n计算预训练语言模型的损失函数;/n将训练集输入预训练语言模型,得到段落的向量表示;输入该向量表示及段落的标注数据训练预测分段模型,得到初步预测分段模型;/n将验证集输入预训练语言模型,得到段落的向量表示;将该向量表示输入初步预测分段模型,得到输入段落的初步预测分段结果;对比预测的分段结果与标注的分段结果优化初步预测分段模型,得到最优预测分段模型;/n将待预测的段落x输入预训练语言模型,得到段落x的向量表示,将段落x的向量表示输入最优预测分段模型,得到段落x的分段结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都星云律例科技有限责任公司,未经成都星云律例科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910893066.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top