[发明专利]基于模板的电子公文分类分级系统有效
申请号: | 201810258598.2 | 申请日: | 2018-03-27 |
公开(公告)号: | CN108399164B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 尚方;冉庆辉;孙立业;景菲;韩冰;张凯;王孝余;刘生 | 申请(专利权)人: | 国网黑龙江省电力有限公司电力科学研究院;国网黑龙江省电力有限公司;国家电网公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 岳泉清 |
地址: | 150030 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于模板的电子公文分类分级系统,涉及一种电子公文分类分级系统。本发明为了解决现有的通过信息安全督查手段中敏感字库需统一设定存在适用性较差的问题和仅对敏感词进行匹配的敏感词排查过程存在很多误报的情况。本发明包括用于提供敏感词和停用词的设置操作的敏感词、停用词管理模块;根据用户输入的敏感词和导入的源文件进行学习并生成模板的源文件学习模块;用于待检测文件的文本抽取的扫描模块;用于支持在企业内网环境中选择和导出模版和上级部门上传的源文件、在非企业内网环境只能选择导出模版的模板管理模块;用于将文本按照导出的模板进行敏感词匹配,对段落、全文相似度进行判定的涉密匹配模块。本发明用于电子公文分类分级管理。 | ||
搜索关键词: | 基于 模板 电子 公文 分类 分级 系统 | ||
【主权项】:
1.基于模板的电子公文分类分级系统,其特征在于,包括:敏感词、停用词管理模块,用于为用户提供敏感词和停用词的设置操作;基于敏感词、停用词管理模块,用户根据所在部门自身的实际情况设定只适用于所在部门的敏感词;用户能够设定停用词;所述的敏感词为用户认为文件或页面中涉密或可能涉密的关键词汇或参数;所述的停用词是指为了节省空间和提高搜索效率,在扫描模块进行扫描时在索引页面或处理搜索请求时会自动忽略的字或词;源文件学习模块,根据用户输入的敏感词,针对用户导入的源文件进行学习并生成模板,模板是通过源文件学习之后生成的包含关键词和匹配规则;扫描模块,用于待检测文件的文本抽取,并在文本抽取的过程中自动屏蔽掉文本中的停用词;模板管理模块,用于支持用户在企业内网环境中选择和导出模版以及上级部门上传的源文件;支持用户在在非企业内网环境中仅能选择导出模版;同时还能够支持用户添加和删除模版,添加和删除模版包括用户基于自己设置敏感词对应的模版和从上级部门继承的模板;涉密匹配模块,用于将扫描模块抽取的文本按照用户导出的模板进行敏感词匹配,对段落相似度、全文相似度进行判定;并能够为在企业内网环境中的用户提供待检测文件与模版和源文件的相似内容对比查看操作;并且不支持为在非企业内网环境中的用户提供待检测文件与模版内容的相似内容对比查看。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网黑龙江省电力有限公司电力科学研究院;国网黑龙江省电力有限公司;国家电网公司,未经国网黑龙江省电力有限公司电力科学研究院;国网黑龙江省电力有限公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810258598.2/,转载请声明来源钻瓜专利网。