[发明专利]用于合同类文件的自动内容解析与信息评测方法及系统在审
申请号: | 202210436411.X | 申请日: | 2022-04-25 |
公开(公告)号: | CN114548072A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 严鹏;孙林君 | 申请(专利权)人: | 杭州实在智能科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/284;G06F40/103;G06F40/295;G06F40/30;G06N20/00 |
代理公司: | 浙江永鼎律师事务所 33233 | 代理人: | 周希良 |
地址: | 310000 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 同类 文件 自动 内容 解析 信息 评测 方法 系统 | ||
本发明属于人工智能技术领域,具体涉及用于合同类文件的自动内容解析与信息评测方法及系统。方法包括S1,判断合同文件格式,并采用不同的工具对合同文件内的文本进行提取;S2,将提取出的文本进行拆分,并输入已建立的合同类Bert模型,解析出关键信息;S3,利用评分模型对解析出的关键信息进行信息风险评测;S4,将信息风险评测结果在可视化界面端进行展示。系统包括合同文本提取模块、合同文本解析模块、合同文本评测模块和可视化展示模块。本发明具有消耗资源少,能自动高效抽取关键信息,且能够处理各类格式文档的特点。
技术领域
本发明属于人工智能技术领域,具体涉及用于合同类文件的自动内容解析与信息评测方法及系统。
背景技术
合同文本是一种典型的非结构化数据,通常需要人工将结构化信息录入到合同管理系统中,例如:“合同名称”、“合同甲方乙方”、“合同签订日期”、“合同金额”、“合同支付方式”、“争议解决方式”等。最初是通过人工进行信息抽取,后续转变为基于规则或者关键词的信息提取。现如今通过人工智能领域的自然语言处理技术手段,能够将上述所需关键信息智能抽取,不仅节省了人工的成本,还降低了因操作失误可能带来的风险。结构化的信息也对后续的业务规则应用、数据分析带来了极大的便利性。
目前合同解析一般有以下几种方法:
1.针对大量合同,人工将合同拆解,并且将关键信息归纳到数据库中,该类方法目前已较少使用;
2.正则表达式或SQL语言(Structured Query Language,结构化查询语言)结合句法依赖及语法规则将合同中固定表达拆解,提取出关键信息。专利《技术合同判定方法、电子装置、计算机设备和存储介质》中根据预设规则库抽取与成果相关的所述句词模型和所述条目,对其进行规则判断以得到判定结果;
3.穷举所有待抽取关键信息做词典匹配,匹配出合同中出现的关键信息。
4.基于自然语言处理技术,对合同文本进行语义解析,提取出关键信息。
然而现有合同解析方法存在以下缺点:
1.人工解析费时费力,且需要一定的专家知识,人工成本过高。
2.正则表达式或者SQL语言准确性极为依赖句法和语法规则的完备性,若合同中存在未包含在句法和语法规则中的表达式,则无法准确解析出关键信息,当句法和语法规则库存在规则冲突时,则会造成解析冲突导致失败。
3.穷举所有待抽取关键信息需花费大量时间和资源,且不一定能完全列举出,若某关键信息不存在则会导致解析不成功。
4.基于自然语言处理技术的语义解析方法优于句法和语法规则的自动解析方法。当前所使用的语义解析方法较为基础,常用的为RNN(Recurrent Neural Network,循环神经网络)和CNN(Convolutional Neural Network,卷积神经网络),该类模型因本身结构限制不具备较强泛化能力,在合同解析任务中速率与效果无法令人满意。现有的基于深度学习或自然语言处理技术,是将整个合同文本或合同内大段的权利或义务条款进行特征向量提取,并对此全文或大段内容的特征向量进行分类或者风险评估,没有针对合同的具体关键信息如合同甲乙方、签约日期、支付方式等进行提取和风险判别。
基于上述问题,设计一种消耗资源少,能自动高效抽取关键信息,且能够处理各类格式文档的用于合同类文件的自动内容解析与信息评测方法及系统,就显得十分重要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州实在智能科技有限公司,未经杭州实在智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210436411.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种园林建筑用搅拌机
- 下一篇:一种稀土基红外升温保暖织物及其制备方法和应用