[发明专利]一种基于文本相似度的裁判文书的证据链关系模型构建方法在审
申请号: | 201810534766.6 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108763485A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 葛季栋;周业茂;董艺璇;李传艺;庄楚涵;周筱羽;骆斌 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种基于文本相似度的裁判文书证据链关系模型构建方法,该构建方法的主要步骤包括:(1)针对中文裁判文书进行文本预处理;(2)读取预处理后裁判文书中的证据段与事实段;(3)抽取证据链体及事实的What、Where、Who、When和How Much这五类关键要素;(4)通过计算关键要素联结计算构造证据链关系模型中的证据与证据的关联以及证据与事实的关联完成模型构建;(5)并计算建模后的证据链关系模型中每条证据链的权重;(6)将构建出的模型以Excel表格格式输出;(7)使用证据链建模工具展示生成的证据链关系模型的结构。本发明主要针对中国法律裁判文书说理评估中的证据链关系模型构建任务,根据裁判文书说理的特征和法院文书的结构特点,改善裁判文书预处理方法,优化关键要素提取技术,能够有效运用于评估裁判文书的事实说理水平。 | ||
搜索关键词: | 证据链 关系模型 裁判 构建 关键要素 预处理 证据 文本相似度 文本预处理 读取 关联 格式输出 建模工具 模型构建 有效运用 建模 评估 权重 抽取 联结 中文 优化 法院 展示 法律 | ||
【主权项】:
1.一种基于文本相似度的裁判文书的证据链关系模型构建方法,其特征是针对中文裁判文书的特点,使用基于Word2vec模型的文本相似度计算来进行证据链关系模型的构建,包括以下步骤:步骤(1)对裁判文书进行预处理,包括裁判文书分段、提取分段后案件基本情况段中的事实段与事实段所对应的证据段、并提取每条证据的属性;步骤(2)选择文书中的事实段与对应事实的证据段作为输入;步骤(3)提取证据段与事实段中的“What”、“Where”、“Who”、“When”和“How Much”这五类要素,作为关键要素;步骤(4)针对证据与事实中的关键要素,使用文本相似度计算得到证据与证据、证据与事实的联结点;步骤(5)计算裁判文书中每个证据链关系模型的权重;步骤(6)使用Excel表格展示裁判文书中构建的证据链关系模型;步骤(7)在证据链建模工具中展示构建的证据链关系模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810534766.6/,转载请声明来源钻瓜专利网。