[发明专利]一种监控方法和装置在审
申请号: | 202010962621.3 | 申请日: | 2020-09-14 |
公开(公告)号: | CN112100616A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 李仕毅;任云翔;张树民 | 申请(专利权)人: | 北京天空卫士网络安全技术有限公司 |
主分类号: | G06F21/55 | 分类号: | G06F21/55;G06F21/62 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;郭晗 |
地址: | 100176 北京市北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监控 方法 装置 | ||
1.一种监控方法,其特征在于,包括:
获取待保护的结构化数据,所述结构化数据包含一个或者多个数据单元;对所述数据单元中包含的文本执行分词操作形成指纹词;生成所述指纹词的指纹词哈希值;并确定所述指纹词的结构化信息;
基于所述指纹词在所述数据单元中的顺序,获取所述数据单元包含的各个所述指纹词哈希值;根据所述顺序并基于各个指纹词哈希值生成单元哈希值;
存储所述指纹词哈希值、所述单元哈希值、所述指纹词的所述结构化信息到指纹数据集合中;
接收待监控的文本,对所述文本执行分词操作形成目标词,并生成所述目标词哈希值;在所述指纹数据集合中查找与所述指纹词哈希值匹配的目标词哈希值,存储查找到的所述目标词哈希值形成目标词集合;
基于所述目标词集合中包含的所述目标词哈希值,生成组合哈希值集合;当组合哈希值集合中存在与所述指纹数据集合中的所述单元哈希值匹配的组合哈希值时,生成告警信息。
2.根据权利要求1所述的方法,其特征在于,
存储所述指纹词哈希值到指纹数据集合中,包括:
当多个所述数据单元中包含相同的指纹词时,存储唯一指纹词对应的所述指纹词哈希值到所述指纹数据集合中。
3.根据权利要求1所述的方法,其特征在于,
根据所述顺序并基于各个指纹词哈希值生成单元哈希值,包括:
根据第一个指纹词哈希值和第二个指纹词哈希值生成中间哈希值;将中间哈希值作为当前哈希值,执行以下循环操作,直到遍历所述指纹哈希值完成,将最后一个中间哈希值作为单元哈希值:
根据所述当前哈希值与下一个指纹哈希值,生成中间哈希值;将所述中间哈希值作为当前哈希值。
4.根据权利要求1所述的方法,其特征在于,
在所述指纹数据集合中查找与所述指纹词哈希值匹配的目标词哈希值,包括:
当在所述指纹数据集合中查找到与指纹词哈希值匹配的目标词哈希值时,获取所述指纹词哈希值对应的所述指纹词的所述结构化信息。
5.根据权利要求4所述的方法,其特征在于,
所述指纹词的所述结构化信息至少包括所述指纹词在所述待保护的结构化数据的所述数据单元中出现的位置索引。
6.根据权利要求1所述的方法,其特征在于,
接收待监控的文本,对所述文本执行分词操作形成目标词,并生成所述目标词哈希值,包括:
按照所述目标词在所述待监控的文本中的顺序,确定所述目标词哈希值的目标顺序。
7.根据权利要求6所述的方法,其特征在于,
在所述指纹数据集合中查找与所述指纹词哈希值匹配的目标词哈希值,根据查找到的所述目标词哈希值形成目标词集合;根据所述目标顺序,确定所述目标词集合中所包含的各个所述目标词哈希值的排列顺序。
8.根据权利要求1或者5所述的方法,其特征在于,
基于所述目标词集合中包含的所述目标词哈希值,生成组合哈希值集合;包括:
获取各个目标词哈希值;从第一个目标词哈希值到最后一个目标词哈希值,分别执行以下操作,生成组合哈希值集合:
按照顺序,根据所述目标词哈希值和相邻的N个目标词哈希值生成中间哈希值;将所述中间哈希值存储于组合哈希值集合中;其中,N分别为从1到目标词哈希值的总数减1范围内的正整数;
获取所述目标词哈希值对应的所述目标词,以及匹配于所述目标词的所述指纹数据集合中的所述指纹词,获取所述指纹词的所述位置索引,根据所述位置索引,判断是否跳过所述目标词哈希值而执行下一个目标词哈希值的所述操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京天空卫士网络安全技术有限公司,未经北京天空卫士网络安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010962621.3/1.html,转载请声明来源钻瓜专利网。