[发明专利]一种基于知识图谱的诈骗网站关联方法及系统有效
申请号: | 202210077475.5 | 申请日: | 2022-01-24 |
公开(公告)号: | CN114124576B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 张浩;马永霄;漆伟;张瑞冬;童永鳌;朱鹏 | 申请(专利权)人: | 成都无糖信息技术有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;G06F16/36;G06F16/25;G06F16/215 |
代理公司: | 成都为知盾专利代理事务所(特殊普通合伙) 51267 | 代理人: | 李汉强 |
地址: | 610000 四川省成都市高新*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 诈骗 网站 关联 方法 系统 | ||
本发明公开了一种基于知识图谱的诈骗网站关联方法及系统,本发明通过对未知诈骗网站数据按规则清洗,并按设计好的诈骗网站的团伙分析结构存入知识图谱中,然后通过知识图谱的结构对新存入的诈骗网站进行判断是否属于已知诈骗网站的团伙还是新的诈骗网站的团伙,通过对未知的诈骗网站数据和已知的知识图谱中的数据进行比对和计算,判别是否为已知团伙的诈骗网站,更新知识图谱:对新添加的图谱数据进行一个判别后,然后根据已知团伙和未知团伙的方式更新图谱内的团伙信息用以后续关联分析,以实现在线学习的效果,可分析诈骗网站之间的关联关系并深入挖掘隐藏的信息线索。
技术领域
本发明属于知识图谱(KnowledgeGraph)领域,具体涉及一种基于知识图谱的诈骗网站关联方法及系统。
背景技术
知识图谱,是结构化的语义知识库、用于迅速描述物理世界中的概念及其相互关系。
知识图谱通过对错综复杂的文档的数据进行有效的加工、处理、整合,转换为简单、清晰的“实体,关系,实体”的三元组,最后聚合大量知识,从而实现知识的快速响应和推理。
从构建好知识图谱后,用它来解决具体的问题,这时从算法的角度来讲,有两个不同的场景:一种是基于规则的;另一种是基于概率的。鉴于目前AI技术的现状,基于规则的方法论还是在垂直领域的应用中占据主导地位,但随着数据量的增加以及方法论的提升,基于概率的模型也将会逐步带来更大的价值。
发明人发现在诈骗网站关联方法中离散数据没有可分析和可使用的相关结构数据,且不能深度分析并生成可辅助团伙分析的节点和关系,不能数据中隐藏的有价值的数据与数据之间的关系,从而不能对未知网站进行判别是否为诈骗网站等非法网站,因此如何对未知网站是否为非法网站的判别成为了网络安全的一个重要课题。
发明内容
本发明的目的是为了克服上述技术问题,提出了一种基于知识图谱的诈骗网站关联方法及系统,具体是通过分析采集后的数据,并通过后期的知识图谱相关技术对数据加工,并融合了大数据分析(LargeDataAnalysis)、数据挖掘(DataMining)。
为实现上述目的本发明所采用的技术方案是:一种基于知识图谱的诈骗网站关联方法,其包括
数据清洗:对原始采集到的诈骗网站数据去掉不符合分析要求的数据,然后将符合分析要求的数据通过设计好的知识图谱映射到图数据库中;
知识图谱团伙分析:通过设置规则和计算生成用于辅助诈骗网站的团伙分析的关系和节点,并得到团伙分析的结果,通过团伙信息将诈骗网站进行关联后,对诈骗网站进行关联分析;
未知诈骗网站判别:基于已知诈骗网站信息判别未知网站与已知网站的关联关系,并动态的更新诈骗网站的团伙信息,以达到在线学习的效果,以便对未知网站进行一个团伙的判断和进行后续的关联分析;
对已知诈骗网站关联:通过诈骗网站之间的关联数据、关联内容,统计信息挖掘深层次的隐藏线索信息,并可视化展示便于后续的人工查看和分析。
进一步地,所述数据清洗包括:
A.通过数据统计和知识图谱设计的知识,分析采集好的数据;
B.根据分析采集好的数据信息,设计知识图谱的结构,用于描述数据在物理世界中的概念;
C.根据设计好的知识图谱结构,将采集的数据通过唯一ID表示唯一的节点和唯一的关系的形式一一对应方式进行检测,有能相互匹配对应的则合并,没有则导入的方式检测数据;
D.通过上述检测方式按设计好的图谱格式导入图库,用以结构化的描述所有采集的涉嫌人员登录数据;
E.通过上述导入的图库的结构化数据用以后续诈骗网站关系生成分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都无糖信息技术有限公司,未经成都无糖信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210077475.5/2.html,转载请声明来源钻瓜专利网。