[发明专利]一种裁判文书格式化处理方法在审
申请号: | 201910698875.6 | 申请日: | 2019-07-31 |
公开(公告)号: | CN110599289A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 杨玉东;贺爱英;李英韬;李洪生;张明良;范路佳 | 申请(专利权)人: | 长春市万易科技有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q50/18 |
代理公司: | 22214 长春众邦菁华知识产权代理有限公司 | 代理人: | 于晓庆 |
地址: | 130000 吉林省长春市*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 裁判 格式化处理 格式化数据 检索 自然语言处理技术 人工智能领域 格式化 类别识别 企业关系 企业数据 企业信用 时间检索 数据存储 信息核实 重要数据 自动添加 自动形成 文本化 计算机 分出 识读 工作量 公文 关联 应用 案件 | ||
一种裁判文书格式化处理方法,涉及计算机中人工智能领域,解决了文本化裁判文书自动变成格式化数据这一技术问题。本发明包括:裁判文书类别识别;标题识别;文号识别;时间检索;案件摘要;被告检索;原告检索;数据存储;信息查重;信息核实;企业数据关联。本发明的特点在于将常规格式化公文与自然语言处理技术结合于一体,应用在裁判文书领域中。通过对裁判文书的格式化处理,分出裁判文书的类别、原告、被告、发生时间等信息,自动形成计算机可识读的格式化数据,并自动添加到企业关系表中,形成了企业信用的重要数据,解决了人工格式化处理的工作量问题。
技术领域
本发明涉及计算机中人工智能技术领域,具体涉及一种裁判文书格式化处理方法。
背景技术
信用是在人们经济交往过程中产生的,因此,一个国家经济交往状况对该国家的信用体系建设有决定性的影响。近几年随着中国的经济的快速发展,国家也意识到信用的重要作用,也努力建设信用体系,力争加快进入信用社会的步伐,但国内的信用体系很难做到像欧美那样,尤其是在信用体系的基础环节- 征信体系方面,更是举步维艰。
为了建立起我国信用体系的基本框架,国家将培育信用市场主体,大力发展信用服务业作为七大重要对策措施之一。信用服务企业通过生产信用报告、开展信用评级、信用担保、商账追收和信用管理咨询等信用业务,为授信单位提供信用风险管理服务,在信用体系中发挥着市场主体作用。
裁判文书作为判定一个企业或个人信用的重要组成部分,是对其风险判定的重要参考依据,而裁判文书每天的发布量大约为几万条,这些如果单靠人工进行分类整理,不仅需要大量的人力和财力支持,且长时间重复工作,造成准确率急剧下降。
人工智能技术的发展,尤其是中文的命名实体识别技术的发展,给通过计算机自动识别裁判文书、并对裁判文书进行格式化处理提供了技术可能。
由于裁判文书往往是非结构化信息,不能依靠简单的结构解析就提取出想要的信息,而是需要自然语言处理技术来提取出裁判文书中的关键信息。如何采用计算机自动将文本化裁判文书变成格式化数据是目前亟待解决的重要问题。
发明内容
为了解决文本化裁判文书自动变成格式化数据这一技术问题,本发明提供一种裁判文书格式化处理方法,属于一种针对专用公文的自然语言处理方法。
本发明为解决技术问题所采用的技术方案如下:
本发明的一种裁判文书格式化处理方法,包括以下步骤:
步骤一、裁判文书类别识别;
对裁判文书的类别进行维护:刑事案件、民事案件、行政案件、赔偿案件、执行案件;在采集裁判文书数据的过程中,根据不同的栏目进行分类标识,刑事案件:CR;民事案件:CI;行政案件:AD;赔偿案件:CO;执行案件:EX;
步骤二、标题识别;
默认为单独一行“最高人民法院”为标题行,其下面一整行内容为该裁判文书的类别标识;
步骤三、文号识别;
步骤四、时间检索;
完成发文日期、案件发生日期范围、审理日期范围的格式化;
步骤五、案件摘要;
步骤六、被告检索;
步骤七、原告检索;
步骤八、数据存储;
将步骤一至步骤七所产生的裁判文书分解的数据保存到数据库中,并标识数据来源、采集日期,同时存储整个裁判文书文件及可疑性判断;
步骤九、信息查重;
步骤十、信息核实;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春市万易科技有限公司,未经长春市万易科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910698875.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理装置及信息处理方法
- 下一篇:跨境交易的数据处理方法和系统