[发明专利]基于人工智能的非结构化文档监管方法及存储介质在审
申请号: | 202111344801.6 | 申请日: | 2021-11-15 |
公开(公告)号: | CN114064920A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 郑敏;阮义清;罗建新;池毓成;陈颖华 | 申请(专利权)人: | 福建正孚软件有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N3/04;G06N3/08;G06Q10/06 |
代理公司: | 福州市景弘专利代理事务所(普通合伙) 35219 | 代理人: | 施文武 |
地址: | 350001 福建省福州市鼓楼*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 结构 文档 监管 方法 存储 介质 | ||
本发明涉及一种基于人工智能的非结构化文档监管方法及存储介质,所述存储介质包括以下步骤:从企业或者项目中获取监管文档作为双向LSTM+RNN实体及实体关系抽取联合模型训练的素材,并通过模型训练输出实体及实体关系抽取联合模型;将训练得到的实体及实体关系抽取联合模型封装为实体及实体关系识别服务;监管过程中,不断输入监管文档供实体及实体关系识别服务进行信息抽取,构建监管知识图谱;通过监管知识图谱,对非结构文档进行监管。代替原有的通过人工梳理规则,效果更显著,覆盖更全面。
技术领域
本发明涉及文档监管技术领域,特别涉及一种基于人工智能的非结构化文档监管方法及存储介质。
背景技术
在企业运营或者项目管理过程中存在各种工程项目过程文档、财务文件、制度规范文档等等,从中挖掘项目过程纰漏、环节缺失、财务资金混乱、制度执行不到位等信息,并予以集中发现、监管和风险评估;以往这些工作从海量文档中人工批阅且分析发现文档信息问题的监管模式,需要投入大量的人力,存在效率低下、遗漏多、监管滞后等等众多问题。而现有的文档监管的技术方案中,如申请号为CN202111021148.X公开的一种基于综合安全审计的文档监控管理系统,如申请号为CN202110759545.0基于云平台的电子文档分类监管系统,虽然可以对文档进行监控或者监管,但是均未解决发现多个文档潜在关系,并对文档内容实体或者实体关系进行监管,同时数据补入均采用人工录入方式,人工成本高。
发明内容
为此,需要提供一种基于人工智能的非结构化文档监管方法及存储介质,解决现有的企业运营或者项目管理过程中的各种文档监管需要投入大量人力,效率低下、遗漏多、监管滞后以及无法解决发现多个文档潜在关系等监管问题。
为实现上述目的,发明人提供了一种基于人工智能的非结构化文档监管方法,包括以下步骤:
从企业或者项目中获取监管文档作为双向LSTM+RNN实体及实体关系抽取联合模型训练的素材,并通过模型训练输出实体及实体关系抽取联合模型;
将训练得到的实体及实体关系抽取联合模型封装为实体及实体关系识别服务;
监管过程中,不断输入监管文档供实体及实体关系识别服务进行信息抽取,构建监管知识图谱;
通过监管知识图谱,对非结构文档进行监管。
进一步优化,所述“通过监管知识图谱,对非结构文档进行监管”具体包括以下步骤:
通过监管知识图谱及监管规则库,对企业或者项目的风险进行评估。
进一步优化,所述监管规则库为通过平台预置并后续不断录入完善。
进一步优化,所述“通过监管知识图谱,对非结构文档进行监管”具体还包括以下步骤:
通过监管知识图谱对监管问题溯源分析定位根源或者影响因子。
进一步优化,所述步骤“通过监管知识图谱对监管问题溯源分析定位根源或者影响因子”之后还包括步骤:
根据可视化技术呈现监管问题的影响范围。
还提供了另一个实施例,一种存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器运行时执行以下步骤:
从企业或者项目中获取监管文档作为双向LSTM+RNN实体及实体关系抽取联合模型训练的素材,并通过模型训练输出实体及实体关系抽取联合模型;
将训练得到的实体及实体关系抽取联合模型封装为实体及实体关系识别服务;
监管过程中,不断输入监管文档供实体及实体关系识别服务进行信息抽取,构建监管知识图谱;
通过监管知识图谱,对非结构文档进行监管。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建正孚软件有限公司,未经福建正孚软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111344801.6/2.html,转载请声明来源钻瓜专利网。