[发明专利]一种面向裁判文书的文本标注方法在审

专利信息
申请号: 201811170433.6 申请日: 2018-09-26
公开(公告)号: CN109408788A 公开(公告)日: 2019-03-01
发明(设计)人: 葛季栋;李传艺;杨翠;蒋政;陈震昊;程芸菲;周沁涵;骆斌 申请(专利权)人: 南京大学
主分类号: G06F17/24 分类号: G06F17/24;G06F17/22
代理公司: 暂无信息 代理人: 暂无信息
地址: 210093 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 标注 文本标注 裁判 导出 文本 工作效率 任务分配 数据采集 数据文件 文本分割 序号分配 用户登录 用户分配 创建 登录 分段 抽取 管理
【说明书】:

发明公开了一种面向裁判文书的文本标注方法,包括以下步骤:从裁判文书文本中分段抽取与文本分割,形成Excel格式的待标注数据文件;管理员登录与待标注数据导入;管理员创建普通用户;管理员创建待标注项目与为普通用户分配待标注数据;普通用户登录与提交标注;管理员导出标注后的数据。本发明加强了对项目参与人员的管理,采用输入序号分配文本的设计,集成了标注任务分配、标注数据采集和导出的功能,提高了面向裁判文书的文本标注的工作效率。

技术领域

本发明涉及一种面向裁判文书的文书标注方法,属于大数据挖掘技术领域。

背景技术

降低司法成本,提高司法效率一直是中国司法改革进程的主旋律。随着大数据时代的到来,如何利用大数据技术对司法审判中产生的海量数据进行采集、分析、整理、归类,充分利用好案件数据信息,挖掘数据价值,让信息技术为司法审判和经济社会发展服务成为一项值得研究的重要课题。

在司法审判中,裁判文书作为法律审判活动记录的载体,完整反映了当事人主张、举证的客观构成,并全面阐述了裁判文书结果形成的法律依据、事实证据和推理过程。截止2018年7月,已有超过4800万份裁判文书被收录并公布于中国裁判文书网。如今大数据战略已成为我国的重要发展战略,我国开始全面实施促进大数据发展行动。与此同时,人民法院也在大力推进智慧法院建设,以充分利用案件数据信息,让大数据为司法审判和经济社会发展服务。研究裁判文书中事实和法条的关系是法院人工智能领域大有可为的课题。一方面可以为法官推荐案件可能适用的法条,提高法官的工作效率。另一方面法条推荐可以帮助当事人了解同类案件的诉讼结果和相关法条,形成最佳的诉讼策略,节约法律咨询和诉讼的成本。而由于该研究领域的特殊性,在学术界并没有相关的公开数据集,需要准备大量的人工标注数据集。传统的文书标注方法存在难于管理和统计的问题,本发明就是为解决这一问题而产生的。本发明不仅为法条推荐等相关工作提供了研究数据集,而且还便于管理和统计数据集。

面向裁判文书的文书标注方法对于法条推荐等相关研究工作的价值体现在,一方面面向裁判文书的文书标注方法可以为法条推荐提供数据集,有利于法条推荐相关研究工作的展开。一方面与传统的文书标注相比,本文的面向裁判文书的文书标注方法可以更科学地统计和管理数据,节省了大量的时间和精力。

发明内容

本发明是一种面向裁判文书的文本标注方法,提供一种裁判文书文本预处理的方法,包括对裁判文书文本中抽取与文本分割,待标注数据导入,待标注项目分配,用户登录与提交标注,导出标注后的数据。

该方法能为法条推荐等研究工作提供大量的文本标注数据集,并对得到数据集进行相关的统计和管理,节省大量时间和精力。

1.一种面向裁判文书的文本标注方法,其特征在于包含以下步骤:

步骤(1)从裁判文书文本中分段抽取与文本分割,形成Excel格式的待标注数据文件;

步骤(2)登录与待标注数据导入;

步骤(3)创建普通用户;

步骤(4)创建待标注项目与为普通用户分配待标注数据;

步骤(5)登录与提交标注;

步骤(6)登录与标注后的数据导出;

2.根据权利要求1所述的一种面向裁判文书的文本标注方法,其特征在于步骤(1)中从裁判文书文本中分段抽取与文本分割,形成Excel格式的待标注数据文件。具体子步骤包括:

步骤(1.1)文书结构化;

步骤(1.2)抽取文书的事实段与所引法条列表;

步骤(1.3)建立文书事实集;

步骤(1.4)建立引用法条正文集;

步骤(1.5)创建文书标注表格。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811170433.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top