[发明专利]网络地址匹配模型的训练方法和网络地址匹配方法有效
申请号: | 202110822040.4 | 申请日: | 2021-07-20 |
公开(公告)号: | CN113434792B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 徐胜超 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955;G06N20/00;H04L45/74 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 鄢功军 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络地址 匹配 模型 训练 方法 | ||
1.一种网络地址匹配模型的训练方法,包括:
确定与第一资源的多个扩展标识一一对应的多个第一网络地址特征样本;
利用所述多个第一网络地址特征样本,对网络地址匹配模型进行第一训练,得到第一训练匹配模型;
确定与第二资源的多个网络地址一一对应的多个第二网络地址特征样本;以及
利用所述多个第二网络地址特征样本,对所述第一训练匹配模型进行第二训练,得到第二训练匹配模型;
其中,确定与第一资源的多个扩展标识一一对应的多个第一网络地址特征样本包括:
解析所述第一资源的网络地址,获得所述第一资源的原始标识;
解析所述第一资源的原始标识,得到所述第一资源的多个扩展标识;以及
根据所述多个扩展标识中的每个扩展标识,确定所述第一网络地址特征样本,其中,每个所述第一网络地址特征样本包含第一资源的多个扩展标识中的一个。
2.根据权利要求1所述的方法,其中,所述利用所述多个第一网络地址特征样本,对网络地址匹配模型进行第一训练,包括:
使用网络地址匹配模型,确定所述多个第一网络地址特征样本彼此之间的匹配度;
根据所述多个第一网络地址特征样本彼此之间的匹配度,得到第一匹配准确率;以及
在所述第一匹配准确率小于第一准确率阈值的情况下,调整所述网络地址匹配模型的参数,并返回使用网络地址匹配模型,确定所述多个第一网络地址特征样本彼此之间的匹配度的步骤。
3.根据权利要求1所述的方法,其中,所述确定与第二资源的多个网络地址一一对应的多个第二网络地址特征样本包括:
获取第二资源的多个网络地址;
针对所述第二资源的多个网络地址中的每个网络地址,确定与所述网络地址对应的域名、网络地址路径、资源标识和名称特征;以及
将所述域名、所述网络地址路径、所述资源标识和所述名称特征,作为所述第二网络地址特征样本。
4.根据权利要求3所述的方法,其中,所述利用与第二资源的多个网络地址一一对应的多个第二网络地址特征样本,对所述第一训练匹配模型进行第二训练,包括:
使用第一训练匹配模型,确定所述多个第二网络地址特征样本彼此之间的匹配度;
根据多个第二网络地址特征样本彼此之间的匹配度,得到第二匹配准确率;以及
在所述第二匹配准确率小于第二准确率阈值的情况下,调整所述第一训练匹配模型的参数,并返回使用第一训练匹配模型,确定所述多个第二网络地址特征样本彼此之间的匹配度的步骤。
5.一种网络地址匹配方法,包括:
获取第一网络地址和第二网络地址;
分别确定所述第一网络地址的网络地址特征和所述第二网络地址的网络地址特征;以及
将所述第一网络地址的网络地址特征和所述第二网络地址的网络地址特征依次输入网络地址匹配模型,得到所述第一网络地址和所述第二网络地址之间的匹配度,
其中,所述网络地址匹配模型是利用权利要求1-4中任一项所述的方法训练的。
6.根据权利要求5所述的方法,其中,所述确定所述第一网络地址的网络地址特征包括:
解析所述第一网络地址,得到第一域名、第一网络地址路径和第一资源标识;
根据与所述第一网络地址对应的第一资源名称,确定第一名称特征;以及
确定所述第一域名、所述第一网络地址路径、所述第一资源标识和所述第一名称特征,作为所述第一网络地址的网络地址特征。
7. 根据权利要求6所述的方法,其中,所述根据所述第一资源名称,确定第一名称特征,包括:
对所述第一资源名称进行切词处理,得到第一切词结果;以及
根据所述第一切词结果,确定第一名称特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110822040.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于储罐底板真空试验的装置
- 下一篇:一种农业有机肥料制备用发酵装置