[发明专利]网站域名相似度检测方法和装置在审
申请号: | 202010548219.0 | 申请日: | 2020-06-16 |
公开(公告)号: | CN113807087A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 蔡鑫;施丽佳 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F16/955 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 赵倩男 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网站 域名 相似 检测 方法 装置 | ||
将待检测网站域名字符串与目标网站域名字符串进行匹配;
获取所述待检测网站域名字符串与所述目标网站域名字符串之间的多个公共子串,其中,每个所述公共子串中包括一个或多个字符,相邻两个所述公共子串之间相隔至少一个字符,所述至少一个字符不属于任何一个所述公共子串;以及
根据所述多个公共子串中的字符个数之和,与所述目标网站域名字符串中的字符个数的比值,确定待检测网站域名与目标网站域名的相似度。
2.根据权利要求1所述的网站域名相似度检测方法,其中,获取所述待检测网站域名字符串与所述目标网站域名字符串之间的多个公共子串包括:
基于最长公共子串算法对应的递推矩阵,构建所述待检测网站域名字符串与所述目标网站域名字符串之间的矩阵;
按照字符串字符个数由大到小的顺序,通过重复迭代查找,确定每一次迭代的局部极大矩阵;以及
将每个局部极大矩阵对应的字符串,作为一个公共子串。
3.根据权利要求2所述的网站域名相似度检测方法,其中,
第n次迭代得到的局部极大矩阵与之前任意第k次迭代得到的局部极大矩阵的坐标满足(xn-xk)(xn+Ln-xk-Lk)>0,且(yn-yk)(yn+Ln-yk-Lk)>0,其中,n、k为自然数,且n>k,xn为第n次迭代得到的局部极大矩阵对应的字符串中的第一个字符在所述目标网站域名字符串中的位置,xk为第k次迭代得到的局部极大矩阵对应的字符串中的第一个字符在所述目标网站域名字符串中的位置,yn为第n次迭代得到的局部极大矩阵对应的字符串中的第一个字符在所述待检测网站域名字符串中的位置,yk为第k次迭代得到的局部极大矩阵对应的字符串中的第一个字符在所述待检测网站域名字符串中的位置,Ln为第n次迭代得到的局部极大矩阵对应字符串的字符个数,Lk为第k次迭代得到的局部极大矩阵对应字符串的字符个数。
4.根据权利要求2所述的网站域名相似度检测方法,其中,
第n次迭代得到的局部极大矩阵与之前任意第k次迭代得到的局部极大矩阵的坐标满足[xn-(xk+Lk-1)][yn-(yk+Lk-1)]>0,其中,n、k为自然数,且n>k,xn为第n次迭代得到的局部极大矩阵对应的字符串中的第一个字符在所述目标网站域名字符串中的位置,xk为第k次迭代得到的局部极大矩阵对应的字符串中的第一个字符在所述目标网站域名字符串中的位置,yn为第n次迭代得到的局部极大矩阵对应的字符串中的第一个字符在所述待检测网站域名字符串中的位置,yk为第k次迭代得到的局部极大矩阵对应的字符串中的第一个字符在所述待检测网站域名字符串中的位置,Lk为第k次迭代得到的局部极大矩阵对应字符串的字符个数。
5.根据权利要求1至4任一所述的网站域名相似度检测方法,还包括:
判断所述待检测网站域名与所述目标网站域名的相似度是否大于阈值,且小于1,若是,则确定所述待检测网站域名为仿冒网站域名。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010548219.0/1.html,转载请声明来源钻瓜专利网。