[发明专利]一种基于配置文件的规范文书处理方法、装置及系统有效
申请号: | 201711408304.1 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108009137B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 任宁;郝思洋 | 申请(专利权)人: | 鼎富智能科技有限公司 |
主分类号: | G06F40/103 | 分类号: | G06F40/103;G06F40/279 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 230000 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例公开了一种基于配置文件的规范文书处理方法、装置及系统,使用至少一个抽取树和一个可编辑的配置文件;抽取树包括多个节点,节点中包含用于对规范文书进行节点匹配的表达式;所述配置文件包含多条配置,包括身份抽取类配置、文书切块类配置和要素抽取类配置。根据配置文件中的所述身份抽取类配置,从规范文书中抽取文书身份;根据文书切块类配置将已知文书身份的规范文书切分成多个内容块;根据要素抽取类配置,从每个内容块中抽取文书要素。由于,本申请使用了一个可编辑的配置文件,因此,只要编辑配置文件的内容,就可以更改从规范文书中抽取的文书要素,从而,能够适应不同的抽取文书要素的需求,适应性强。 | ||
搜索关键词: | 一种 基于 配置文件 规范 文书 处理 方法 装置 系统 | ||
【主权项】:
1.一种基于配置文件的规范文书处理方法,其特征在于,使用至少一个抽取树和一个可编辑的配置文件;所述抽取树包括多个节点,节点中包含用于对规范文书进行节点匹配的表达式;所述配置文件包含多条配置,每条所述配置用于调用所述抽取树中的节点对规范文书进行节点匹配,以及根据节点匹配结果对规范文书执行预设的处理方式;每条所述配置以规范文书全文或其他所述配置对规范文书的处理结果作为处理对象;所述配置包括身份抽取类配置、文书切块类配置和要素抽取类配置,其中,所述文书切块类配置以至少一条所述身份抽取类配置的节点匹配结果作为触发的前置条件,所述要素抽取类配置以至少一条所述文书切块类配置的节点匹配结果作为触发的前置条件;所述方法包括:根据所述配置文件中的所述身份抽取类配置,从规范文书中抽取文书身份;根据所述身份抽取类配置的节点匹配结果,触发满足前置条件的所述文书切块类配置;根据触发的所述文书切块类配置,对规范文书切块,生成规范文书的多个内容块;根据所述文书切块类配置的节点匹配结果,触发满足前置条件的所述要素抽取类配置;根据触发的所述要素抽取类配置,从每个所述内容块中抽取文书要素。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鼎富智能科技有限公司,未经鼎富智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711408304.1/,转载请声明来源钻瓜专利网。