[发明专利]一种网络数据监测方法有效
| 申请号: | 201811482480.4 | 申请日: | 2018-12-05 |
| 公开(公告)号: | CN109918638B | 公开(公告)日: | 2023-03-24 |
| 发明(设计)人: | 徐宏;金鑫;胡遨洋;金海松;花志伟;张振威;杨泰;刘书涵;张杰;商杰;吴蓓佳;张超 | 申请(专利权)人: | 国网浙江桐乡市供电有限公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/35;G06F40/126 |
| 代理公司: | 杭州杭诚专利事务所有限公司 33109 | 代理人: | 尉伟敏 |
| 地址: | 314500 浙江省嘉兴*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 网络 数据 监测 方法 | ||
1.一种网络数据监测方法,其特征在于:该方法包括以下几个步骤;
步骤1:待识别的文本数据获取并预处理;
步骤2:搭建无语义字符库和冷僻字符库以及冷僻字符搭配表,设定冷僻字符以及无字符出现的次数阈值N;
步骤3:遍历预处理后的文本,记录冷僻字符出现次数A以及与冷僻字符相邻的无语义字符数B;
步骤4:制定警告规则,提示网络监管。
2.根据权利要求1所述的一种网络数据监测方法,其特征在于:所述步骤1包括:
步骤11:网络文本数据的获取;
步骤12:对获取到的网络文本数据进行分词处理,对文本中的无语义字符和冷僻字符进行提取和分类。
3.根据权利要求1所述的一种网络数据监测方法,其特征在于:所述步骤2包括:
步骤21:建立无语义字符库和冷僻字符库,搭建冷僻字符搭配表,将与冷僻字相邻的一定字符长度的字符串制定一个字符串集合,以冷僻字作为搜索核心目标进行匹配;
步骤22:设定文本中的字符遍历相同字符出现的次数阈值,用以制定警告,提示需要网络监管。
4.根据权利要求1所述的一种网络数据监测方法,其特征在于:所述步骤3包括:
步骤31:对文本进行特征提取,将冷僻字符和无语义字符进行类别识别;
步骤32:分别遍历无语义字符以及冷僻字符,通过与无语义字符库和冷僻字符库的对照,记录无语义字符以及冷僻字符出现的次数。
5.根据权利要求1所述的一种网络数据监测方法,其特征在于:所述步骤4包括:
步骤41:统计遍历整篇文本的冷僻字符出现次数A和冷僻字符相邻的无语义字符数B,与设定值N进行对比;
步骤42:判定:若A=N,则剔除整篇文档的无语义字符,将剔除无语义字符后的生僻字符与冷僻字符库进行匹配,若匹配成功,则生成关键字;若匹配不成功,更新所述冷僻字符库和所述冷僻字符搭配表;
步骤43:制定关键词集合,以关键字为中心,提取关键字以及相邻的字符作为关键词,生成关键词集合;
步骤44:将关键词集合与冷僻字符搭配表进行匹配,若匹配成功,提示警告,需要网络监管。
6.根据权利要求5所述的一种网络数据监测方法,其特征在于:所述的步骤42包括:更新冷僻字符库以及更新冷僻字符搭配表;
所述关键字如果不在冷僻字符库,需要更新所述冷僻字符库和所述冷僻字符搭配表,具体步骤如下:
步骤421:将关键字作为冷僻字添加到冷僻字符表中,生成新的冷僻字符表作为下一次遍历文本的冷僻字符表。
7.根据权利要求5或6所述的一种网络数据监测方法,其特征在于:所述的更新冷僻字符搭配表有以下规则;
步骤422:遍历整篇文档,记录与冷僻字相邻的无语义字符的个数B,若B=A/2,则将此无语义的字符以及与其相邻的冷僻字符作为关键词,放入关键词集合,将生成的关键词集合添加到所述冷僻字符搭配表中,生成新的冷僻字符搭配表供下一次遍历文本对照。
8.根据权利要求1所述的一种网络数据监测方法:其特征在于:所述的冷僻字符表可以对关键词集合进行语义分析,通过计算语义权重,进行语义判别,制定不同的警告策略。
9.根据权利要求8所述的一种网络数据监测方法:其特征在于:所述的警告策略根据语义分析以及所占语义的权重制定不同的网络监管方法,所述网络监管方法分别为注销IP以及IP跟踪、禁止输入、文本模糊化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江桐乡市供电有限公司,未经国网浙江桐乡市供电有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811482480.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





