[发明专利]一种暗网威胁情报收集与信息关联系统和方法在审
申请号: | 201911154680.1 | 申请日: | 2019-11-22 |
公开(公告)号: | CN110909178A | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 邹福泰;吴晓芸;蒋永康;张恒瑞;吴越 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/25;G06F16/951 |
代理公司: | 上海旭诚知识产权代理有限公司 31220 | 代理人: | 郑立 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 威胁 情报 收集 信息 关联 系统 方法 | ||
本发明公开了一种暗网威胁情报收集与信息关联系统和方法,涉及互联网信息技术领域领域。暗网威胁情报收集与信息关联系统包括暗网数据收集与存储子系统、暗网数据展示和信息关联子系统,暗网数据收集和存储子系统包括暗网代理模块和暗网数据收集模块,暗网数据展示和信息关联子系统包括知识图谱构建模块和明暗网数据匹配模块。本发明有利于为明网网络安全事件溯源提供有效的技术支持,打击暗网中非法售卖漏洞、隐私数据的黑色产业,加强对暗网的监管力度。
技术领域
本发明涉及互联网信息技术领域,尤其涉及一种暗网威胁情报收集与信息关联系统和方法。
背景技术
在狭义上,暗网特指匿名网络,以TOR(The Second Generation Onion Router)匿名通信系统为代表。暗网只能通过特定的技术或者通信协议才能访问,与明网相对。暗网最大的特点是,在暗网中数据传输通常是匿名且匿踪的,能充分保障用户乃至网站服务器的匿名性。而加密货币的诞生使得匿名转账成为可能,这在某种程度上助长了暗网市场中的违法买卖,对信息安全、人身安全、社会稳定等各方面都造成了重大威胁。
知识图谱是结构化的语义知识库。其基本组成单位是“实体-关系-实体”三元组,以及“实体-属性-值”。实体间通过关系相互连接,构成网状的知识结构。在构建知识图谱的过程中,如果数据来源是非结构化数据,则往往需要运用到属性提取、关系提取、实体提取等进行信息抽取技术,利用实体对齐和实体消歧等做知识融合,以建立本体库。网页作为知识图谱非结构化数据的重要来源之一,更是包含大量描述各种实体和实体之间丰富关系的数据万维网。
网页爬虫是收集网页信息的主要方式。暗网爬虫与明网爬虫之间最主要的区别是暗网爬虫需要特定的能接入暗网的代理,其次是由暗网本身地址难以发现、地址容易改变、暗网速度慢且不稳定等暗网本身的特性带来的对爬虫效率的消极影响。
因此,本领域的技术人员致力于研究暗网威胁情报收集与信息关联系统和方法。如何加强对TOR暗网市场的监管,挖掘暗网中威胁情报所蕴含的信息,这对于发现信息安全相关事件的源头,具有重大意义。
发明内容
有鉴于现有现实需求和意义,本发明解决的技术问题是如何获取与指定明网数据关联度高的暗网威胁情报,为明网网络安全事件溯源提供有效的技术支持,加强对暗网的监管力度。
为实现上述目的,发明人从来自暗网的商品及帖子数据中抽取实体和关系,构建描述暗网市场和论坛动态的暗网知识图谱,进一步地获取与指定明网数据关联度高的暗网威胁情报。在本发明的一个实施例中,发明人提供了一种暗网威胁情报收集与信息关联系统,包括暗网数据收集与存储子系统、暗网数据展示和信息关联子系统,所述暗网数据收集和存储子系统包括暗网代理模块和暗网数据收集模块;
所述暗网代理模块是所述暗网数据收集模块中爬虫的代理;所述暗网数据收集模块在本地编写针对不同暗网网站的爬虫程序,借助所述爬虫的代理收集所述暗网网站上的数据,并存储在本地数据库中;
所述暗网数据展示和信息关联子系统,包括知识图谱构建模块和明暗网数据匹配模块;
所述知识图谱构建模块对所述本地数据库中已有的暗网数据进行信息抽取、知识融合,建立多个对应暗网活动的“实体-关系-实体”实例,所述实例融合成知识库,存入所述本地数据库,构建暗网威胁情报的知识图谱;所述明暗网数据匹配模块基于已有的所述暗网威胁情报的知识图谱,对明网网络安全事件的描述进行匹配,优先显示与所述明网网络安全事件关联的“实体-关系-实体”实例。
可选地,在上述任一实施例中的暗网威胁情报收集与信息关联系统,所述暗网代理模块为在云服务器上搭建Tor代理与polipo协议转换器。
可选地,在上述任一实施例中的暗网威胁情报收集与信息关联系统,所述暗网数据收集模块基于scrapy框架,所述本地数据库为MongoDB。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911154680.1/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置