[发明专利]一种数据库内容保密检查系统及检查方法在审
申请号: | 202011232205.4 | 申请日: | 2020-11-06 |
公开(公告)号: | CN112347079A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 王世晞;张亮 | 申请(专利权)人: | 杭州世平信息科技有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/25;G06F16/31;G06F21/60 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 范巍 |
地址: | 310012 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据库 内容 保密 检查 系统 方法 | ||
一种数据库内容保密检查系统及检查方法,包括数据采集模块、涉密检查模块和检查结果输出模块;数据采集模块、涉密检查模块和检查结果输出模块依次连接;在数据采集模块中,采用了各类数据库的直接访问接口,并且设计统一数据访问接口,实现了对大数据、云平台中各类数据库中数据的快速访问,并且通过数据库性能远程监控,利用数据库服务的剩余资源,进一步加快了对数据库中数据的采集与处理。在涉密检查模块中对待检查的各种数据类型包括结构化数据、非结构化数据进行数据内容解析,实现对数据类型检查全覆盖。
技术领域
本发明属于保密检查技术领域,特别涉及一种数据库内容保密检查系统及检查方法。
背景技术
随着信息化的高速发展,信息技术与业务高度融合,为政府部门、企事业单位等带来工作便利的同时,也为保密工作带来了严峻挑战。在此背景下,国家局逐步要求各级保密局进行保密检查全覆盖,进一步督促各级单位自主完成保密检查工作。随着大数据时代的到来,集约化平台、大数据平台的上线,使的终端存储数据所占比重越来越小。但是传统的终端保密检查系统主要是针对终端计算机存储的涉密信息检查,对于集约化平台以及大数据平台数据的检查却无能为力。近年来,市面上也出现了一些针对大数据平台的保密检查系统,但是普遍存在数据采集效率不高以及对采集的数据类型检查的覆盖面不全,多数仅能实现对结构化数据的保密检查,对非结构化数据束手无策,并且存在保密检查准确率不高的问题。
发明内容
本发明的目的在于提供一种数据库内容保密检查系统及检查方法,以解决上述问题。
为实现上述目的,本发明采用以下技术方案:
一种数据库内容保密检查系统,包括数据采集模块、涉密检查模块和检查结果输出模块;数据采集模块、涉密检查模块和检查结果输出模块依次连接;
数据采集模块通过用了各类数据库的直接访问接口,统一数据访问接口采集待检查数据;
涉密检查模块对待检查的各种数据类型包括结构化数据、非结构化数据进行数据内容解析,实现对数据类型检查全覆盖;通过机器学习引入正例、反例对涉密模型进行构建与训练;
检查结果输出模块用于展示检查结果。
进一步的,数据采集模块中所采用的接口包括访问Oracle数据库的OCI接口,访问SQL Server服务器底层函数的DB—Library,MongoDB C Driver跨平台快速访问接口,以及C语言接口和直接访问接口。
进一步的,结构化数据为具有编码和类型的数据,非结构化文档为文档类型混乱的文档,针对非结构化文档使用类型解析器进行解析分类。
进一步的,通过机器学习进行涉密模型构建与训练,将通过检查人员确认的涉密数据作为正例,误报数据作为反例,进行训练模型的建立,对于新的待检查文档,通过训练模型判断其是否涉密,如果是涉密文档,则将其作为正例,反之则作为反例,实现对训练模型的更新,在下次保密检查过程中将应用最新的训练模型进行检测。
进一步的,一种数据库内容保密检查系统的检查方法,包括以下步骤:
步骤1,采用各数据库类型的直接数据访问接口实现对数据的快速访问,并且通过统一数据访问接口的设计,向涉密检查模块提供统一的数据结构;
步骤2,对待检查的结构化数据以及非结构化数据的内容解析提取;
步骤3,采用深度内容识别技术,对内容进行匹配,实现待检查数据的保密检查。
进一步的,结构化文档处理包括:
1)编码检测
系统会根据数据库创建时的编码和类型进行tika解析;
2)编码转换
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州世平信息科技有限公司,未经杭州世平信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011232205.4/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法