[发明专利]一种IP地址数据库生成方法和装置有效
申请号: | 201710355268.0 | 申请日: | 2017-05-19 |
公开(公告)号: | CN107743153B | 公开(公告)日: | 2018-10-30 |
发明(设计)人: | 符立佳;苗辉 | 申请(专利权)人: | 贵州白山云科技有限公司 |
主分类号: | H04L29/12 | 分类号: | H04L29/12;G06F17/30 |
代理公司: | 北京名华博信知识产权代理有限公司 11453 | 代理人: | 李冬梅;苗源 |
地址: | 100015 北京市朝阳区酒仙桥*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 ip 地址 数据库 生成 方法 装置 | ||
本发明提供了一种IP地址数据库生成方法和装置。涉及计算机网络领域;解决了现有IP地址数据库精确度差、效率低下的问题。该方法包括:将抓取的至少一个原始IP地址数据库转化为标准化结构的初级标准库;根据当前业务类型,对所述初级标准库的精度进行修正,生成定制发布库。本发明提供的技术方案适用于IP地址定位,实现了标准化、高精度、可更新的IP地址数据库。
技术领域
本发明涉及计算机网络领域,尤其涉及一种IP地址数据库生成方法和装置。
背景技术
随着互联网的发展,IP库在智能调度、数据分析等方面的地位越来越重要,因而整理获取IP地址定位精准的IP库成为了价值产出非常高的工作。
现有IP库版本繁多,如IPIP、纯真、IP138、IP2location、maxmind等,每个IP库对于相同IP段都有一套独立的描述体系,具有不同的定位特性和精准度(例如省级地域精准、教育网精准、区县级行政区精准)。不同的IP库之间无论是涵盖的IP段范围还是对具体IP的描述均存在差异。在业务系统需要使用IP库时,如采用单一IP库,则很难确定该IP库与当前业务需求是否匹配,且仅单一IP库导致信息来源亦是单一,精确度较差;而采用多IP库对比使用的策略时,又需要面对多个IP库之间的差异,在IP库之间频繁切换对比,效率低下。
发明内容
本发明旨在解决上面描述的问题。
根据本发明的第一方面,提供了一种IP地址数据库生成方法,包括:
将抓取的至少一个原始IP地址数据库转化为标准化结构的初级标准库;
根据当前业务类型,对所述初级标准库的精度进行修正,生成定制发布库。
优选的,所述将抓取的至少一个原始IP地址数据库转化为标准化结构的初级标准库的步骤包括:
匹配所述原始IP地址数据库的定位描述字段和预设的IP库字典的原始库描述字段,将所述原始IP地址库转移为中间库,所述中间库的地址描述至少包含任一或任意多个如下字段:
起始IP,终止IP,国家,ISP,省,市,区县,街道,经纬度,附加字段,原始库名称,
其中,“起始IP”与“终止IP”分别为所述中间库对应的原始IP地址数据库覆盖IP地址段的起始IP地址与终止IP地址,“原始库名称”为所述中间库对应的原始IP地址数据库的名称;
为所述中间库的地址描述中涉及定位描述的各个字段分配权重,得到初级标准库。
优选的,该方法还包括:
在所述涉及定位描述的字段中,地理范围较小的字段权重大于地址范围较大的字段权重时,重置所述地址范围较小的字段的权重为小于等于所述地址范围较大的字段的权重。
优选的,所述根据当前业务类型,对所述初级标准库的精度进行修正,生成定制发布库的步骤包括:
从所述初级标准库中提取符合预置条件的标准字段描述,形成第一发布库;
根据当前业务类型,对所述初级标准库进行二次筛选,得到修正数据;
将所述修正数据与所述第一发布库合并,得到所述定制发布库。
优选的,所述预置条件包含提取精度和/或提取权重,指示对提取精度指向的字段的权重达到所述提取权重的IP地址段进行提取,
所述从所述初级标准库中提取符合预置条件的标准字段描述,形成第一发布库的步骤包括:
将全IP段划分为N个最小IP段,所述最小IP段在抓取的任一原始IP地址数据库对应的初级标准库中都能匹配到相应的定位描述信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州白山云科技有限公司,未经贵州白山云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710355268.0/2.html,转载请声明来源钻瓜专利网。