[发明专利]基于语义网的企业合同审核系统及方法在审
申请号: | 201911420937.3 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111061844A | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 莫紫霄 | 申请(专利权)人: | 重庆木舌科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06Q10/10 |
代理公司: | 重庆强大凯创专利代理事务所(普通合伙) 50217 | 代理人: | 陈家辉 |
地址: | 400060 重庆市南*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 企业 合同 审核 系统 方法 | ||
1.基于语义网的企业合同审核系统,其特征在于:包括导入单元,用于导入合同文档;数据库,用于储存合同模板和标准合同文本;分析单元,用于计算所导入的合同文档与标准合同文本的语义相似度;判断单元,用于判断语义相似度是否满足预设的要求;输出单元,用于根据语义相似度是否满足要求输出审核结果。
2.根据权利要求1所述的基于语义网的企业合同审核系统,其特征在于:还包括分词单元,用于将合同文档连续的字序列重新组合成词序列,并确定该合同文档的关键词;具体步骤包括:S11,切词,将一个汉字序列切分成单独的词;S12,去除没有实际含义的停用词;S13,采用TF-IDF构建词权重,并将权重大的作为关键词。
3.根据权利要求2所述的基于语义网的企业合同审核系统,其特征在于:还包括聚类单元,用于确定最能代表该合同文档类别的关键词;具体步骤包括:S21,输入分词单元确定出的关键词;S22,随机选取K个关键词作为初始的聚类中心;S23,把每个对象分配给距离它最近的聚类中心;S24,重新计算聚类中心;S25,若收敛,输出聚类结果;若不收敛,返回步骤S22。
4.根据权利要求3所述的基于语义网的企业合同审核系统,其特征在于:还包括匹配单元,用于根据聚类结果采用KMP算法匹配合同数据库的合同模板和标准合同文本;具体步骤包括:S1:寻找模式串的每个子串前缀和后缀最长公共元素长度;S2:求next数组;S3:根据next数组进行匹配。
5.根据权利要求4所述的基于语义网的企业合同审核系统,其特征在于:还包括生成单元,用于在合同模板的基础上,根据关键词生成对比合同文本。
6.基于语义网的企业合同审核方法,其特征在于:包括以下步骤:
S1:导入合同文档;
S2:计算所导入的合同文档与标准合同文本的语义相似度;
S3:判断语义相似度是否满足预设的要求;
S4:根据语义相似度是否满足要求输出审核结果。
7.根据权利要求6所述的基于语义网的企业合同审核方法,其特征在于:还包括分词,将合同文档连续的字序列重新组合成词序列,并确定该合同文档的关键词;具体步骤包括:S11,切词,将一个汉字序列切分成单独的词;S12,去除没有实际含义的停用词;S13,采用TF-IDF构建词权重,并将权重大的作为关键词。
8.根据权利要求7所述的基于语义网的企业合同审核方法,其特征在于:还包括聚类,确定最能代表该合同文档类别的关键词;具体步骤包括:S21,输入分词确定出的关键词;S22,随机选取K个关键词作为初始的聚类中心;S23,把每个对象分配给距离它最近的聚类中心;S24,重新计算聚类中心;S25,若收敛,输出聚类结果;若不收敛,返回步骤S22。
9.根据权利要求8所述的基于语义网的企业合同审核方法,其特征在于:还包括根据聚类结果采用KMP算法匹配合同数据库的合同模板和标准合同文本;具体步骤包括:S1:寻找模式串的每个子串前缀和后缀最长公共元素长度;S2:求next数组;S3:根据next数组进行匹配。
10.根据权利要求9所述的基于语义网的企业合同审核方法,其特征在于:还包括在合同模板的基础上,根据关键词生成对比合同文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆木舌科技有限公司,未经重庆木舌科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911420937.3/1.html,转载请声明来源钻瓜专利网。