[发明专利]一种增量码库的建立方法和装置有效
| 申请号: | 201210227185.0 | 申请日: | 2012-06-30 |
| 公开(公告)号: | CN103514235B | 公开(公告)日: | 2017-03-08 |
| 发明(设计)人: | 林锡通;段建国 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙)11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 增量 建立 方法 装置 | ||
1.一种增量码库的建立方法,其特征在于,包括以下步骤:
S1、获取数据图的更新数据;
S2、利用所获取的更新数据与历史增量数据库中的历史增量数据进行比较,将关键属性相异的更新数据确定为非冗余数据;
S3、提取所述非冗余数据中描述地理对象的信息,添加到候选码库中;
S4、对所述候选码库中各候选数据的地理对象名称和空间位置进行判断,将描述同一个地理对象且空间位置在预设阈值范围内的多个候选数据归为同一个判重组;
S5、对同一个判重组内的多个候选数据,根据各候选数据的数据来源的可信度计算各候选数据的权值;
S6、将权值最高的候选数据作为该判重组的码库数据,构成增量码库。
2.根据权利要求1所述的方法,其特征在于,在所述步骤S1之后,还包括:
对所获取的更新数据的格式进行预处理,转换成预定义的数据格式。
3.根据权利要求1所述的方法,其特征在于,所述关键属性包括:
数据的名称、地址、数据来源、可信度和空间位置;
所述关键属性相异的更新数据是指与所述历史增量数据相比,至少有一种关键属性相异的数据。
4.根据权利要求1所述的方法,其特征在于,在所述步骤S2之后,还包括:
将所确定的非冗余数据添加到所述历史增量数据库中。
5.根据权利要求1所述的方法,其特征在于,所述步骤S3包括:
步骤S3_1、对所述非冗余数据的名称或地址进行分词;
步骤S3_2、从名称或地址的分词结果中按照预定义的规则进行规范化处理后,得到描述地理对象的地理对象名称;
步骤S3_3、关联确定所述地理对象名称对应的属性信息,组成一条候选数据,添加到候选码库中;
其中,所述对应的属性信息至少包括:该地理对象的空间位置。
6.根据权利要求5所述的方法,其特征在于,所述关联确定所述地理对象名称对应的属性信息,包括:
将所述地理对象名称所在的非冗余数据中包含的属性信息,确定为该地理对象名称所在的候选数据对应的属性信息;
根据所述空间位置,对所述候选数据进行最小外接矩形计算,预估所述候选数据的范围大小。
7.根据权利要求1所述的方法,其特征在于,在所述根据各候选数据的数据来源的可信度计算各候选数据的数据权值之前,还包括:
判断所述判重组中的候选数据是否正确。
8.根据权利要求7所述的方法,其特征在于,所述判断所述判重组中的候选数据是否正确,具体包括:
对提供数据来源的各个数据提供商提供的数据质量进行评估,确定可信来源的数据提供商;
判断同一个判重组中是否有可信来源的数据,如果有,则认为该判重组中的数据正确,否则,计算判重组中各个候选数据的数据权值,如果判重组中的数据权值不小于预设阈值,则认为该判重组中的数据正确,否则,认为该判重组中的数据错误。
9.根据权利要求1所述的方法,其特征在于,所述根据各候选数据的数据来源的可信度计算各候选数据的数据权值,具体包括:
根据各候选数据的数据来源确定各个候选数据的可信度;
对提供数据来源的各个数据提供商提供的数据质量进行评估,将可信来源的数据作为校验数据;
统计各候选数据关联到的校验数据的数量;
利用各个候选数据和关联到的校验数据的数量,计算得到各候选数据的数据权值。
10.根据权利要求1所述的方法,其特征在于,所述将数据权值最高的候选数据作为该判重组的码库数据,具体包括:
将数据权值最高的候选数据中的地理对象名称和空间位置作为该判重组的码库数据对应的属性值;
根据预设的类别优先级配置文件,从该判重组中所有的类别中确定出该判重组的码库数据的类别;
对于类别为道路类的码库数据,选择包含点最多的候选数据的几何形状作为对应的属性值,并对该判重组中所有的最小外接矩形求并集,得到的结果作为该码库数据的最小外接矩形的属性值,其余的属性对应选择该判重组中数据权值最高的属性值作为对应的属性值;
对于类别为非道路类的码库数据,所有属性均对应选择数据权值最高的属性值作为对应的属性值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210227185.0/1.html,转载请声明来源钻瓜专利网。





