[发明专利]一种合同审计方法和系统,及计算机可读存储介质在审
申请号: | 202010450563.6 | 申请日: | 2020-05-25 |
公开(公告)号: | CN113722421A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 王飞翔;郭宇晨;唐海庆;张国宏;张丽娟 | 申请(专利权)人: | 中移(苏州)软件技术有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/117;G06F40/247;G06F40/30;G06N20/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘恋;张颖玲 |
地址: | 215163 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 合同 审计 方法 系统 计算机 可读 存储 介质 | ||
本发明公开了一种合同审计方法和系统,及计算机可读存储介质,上述合同审计方法包括:采集合同文档数据,并按照预设处理策略对合同文档数据进行预处理,获得训练数据和测试数据;基于训练数据和测试数据,利用机器学习法和/或深度学习法进行模型训练和模型检测,获得目标抽取模型;根据预设规则库和目标抽取模型,获得待审计合同对应的目标抽取结果;根据预设审计规则和目标抽取结果,获得待审计合同对应的审计结果;其中,预设审计规则表征基于Drools规则引擎设计的审计逻辑,从而在进行合同审计时能够大大减少误差,提高了合同审计的准确性。
技术领域
本发明涉及数据检测技术,尤其涉及一种合同审计方法和系统,及计算机可读存储介质。
背景技术
合同是记录公司主要经济事项的重要媒介,是众多审计领域的关键资料。其中,合同审计是指内部审计机构和人员对合同的签订、履行、变更、终止过程及合同管理进行独立客观的监督和评价活动。合同审计的核心是合同关键信息抽取和审计逻辑设计。目前,主要通过规则匹配的方案进行关键信息的抽取,同时,利用固定的审计逻辑进行审计结果的确定。
然而,规则匹配的抽取方法并没有学习能力,同时审计逻辑设计无法满足真实的审计需求,且缺乏错误反馈机制及模型自动更新机制。也就是说,待审计合同的类型和其中的关键信息是复杂多变的,在合同审计业务中仅仅依靠规则匹配的抽取方案和固定的审计逻辑在海量的合同中进行审计工作,得到的审计结果往往存在较大的误差,降低了合同审计的准确性。
发明内容
为解决上述技术问题,本发明期望提供一种合同审计方法和系统,及计算机可读存储介质,在进行合同审计时能够大大减少误差,提高了合同审计的准确性。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种合同审计方法,所述方法包括:
采集合同文档数据,并按照预设处理策略对所述合同文档数据进行预处理,获得训练数据和测试数据;
基于所述训练数据和所述测试数据,利用机器学习法和/或深度学习法进行模型训练和模型检测,获得目标抽取模型;
根据预设规则库和所述目标抽取模型,获得待审计合同对应的目标抽取结果;
根据预设审计规则和所述目标抽取结果,获得所述待审计合同对应的审计结果;其中,所述预设审计规则表征基于Drools规则引擎设计的审计逻辑。
在上述方案中,所述按照预设处理策略对所述合同文档数据进行预处理,获得训练数据和测试数据,包括:
解析所述合同文档数据,获得所述合同文档数据对应的目标文本数据;
根据所述合同文档数据对应的关键信息对所述目标文本数据进行筛选处理,获得筛选后数据;
对所述筛选后数据进行标注处理,获得已标注语料和未标注语料;
将所述已标注语料确定为所述训练数据,将所述未标注语料确定为测试数据。
在上述方案中,所述根据所述合同文档数据对应的关键信息对所述目标文本数据进行筛选处理,获得筛选后数据,包括:
确定所述合同文档数据对应的合同类型;
根据所述合同类型和所述关键信息获取第一触发词集;
按照所述第一触发词集对所述目标文本数据进行筛选处理,获得所述筛选后数据。
由此可见,在本发明中,合同审计系统在确定训练数据和测试数据时,可以基于关键信息,对从合同文档数据中解析获得的目标文本数据进行筛选,从而可以有效地提高训练数据和测试数据的数据质量
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(苏州)软件技术有限公司;中国移动通信集团有限公司,未经中移(苏州)软件技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010450563.6/2.html,转载请声明来源钻瓜专利网。