[发明专利]基于分布式和哈希映射的室外海量物体识别方法和系统有效
申请号: | 201210292376.5 | 申请日: | 2012-08-16 |
公开(公告)号: | CN102880854A | 公开(公告)日: | 2013-01-16 |
发明(设计)人: | 刘越;桂振文;王涌天;陈靖 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F17/30 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 杨志兵;高燕燕 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分布式 映射 室外 海量 物体 识别 方法 系统 | ||
1.一种基于分布式处理和哈希映射的室外海量物体识别方法,其特征在于,预先获取带GPS信息的样本图像,提取每幅样本图像的局部特征并转化为描述符特征向量,再对描述符特征向量进行Hash映射,得到Hash位串称为样本位串;将样本图像的GPS信息、样本图像信息、样本位串对应存储到样本文件系统中;
所述的识别方法包括如下步骤:
步骤1:终端采集当前场景的待识别图像以及GPS信息;
步骤2:提取所述待识别图像的局部特征,并转化为描述符特征向量;
步骤3:将待识别图像的GPS信息以及描述符特征向量打包成一个描述符文件,发送给分布式处理系统;
步骤4:分布式处理系统中设有调度处理集群、多个计算节点和所述样本文件系统;调度处理集群接收到所述描述符文件后,从该描述符文件中提取GPS信息,查询当前正在处理的匹配任务中是否存在与提取的GPS信息相同的匹配任务,如果是,说明已经将与待识别图像相关的样本位串加载到各计算节点中,则将描述符文件发送给每个计算节点,然后执行步骤6;否则,执行步骤5;
所述匹配任务的查询标准为:如果当前正在处理的匹配任务对应的GPS信息与待识别图像的GPS信息一致或者相差一个预设阈值,则认为存在相同的匹配任务;
步骤5:调度处理集群为待识别图像加载相关的样本特征向量:
以待识别图像的GPS信息为圆心,按照预先设定的筛选半径确定一个圆形区域,从样本文件系统中筛选出GPS信息在所述圆形区域内的样本位串,将筛选出的样本位串分摊加载到各个计算节点中;同时,调度处理集群还将描述符文件发送给每个计算节点。
步骤6:每个计算节点从描述符文件中解析出待匹配描述符特征向量,并进行Hash映射,得到待匹配Hash位串;将待识别图像的待匹配Hash位串与已加载的与该识别图像相关的样本位串进行逐个进行汉明比较,将匹配结果汇总到调度处理集群;
步骤7:调度处理集群统计各个计算节点的匹配结果,选出匹配比率最高的样本图像作为匹配图像,将匹配图像的信息返回给所述终端。
2.如权利要求1所述的方法,其特征在于,步骤2中,在提取所述待识别图像的局部特征之前,进一步对所述待识别图像进行降采样处理,以降低图像分辨率。
3.如权利要求1所述的方法,其特征在于,所述步骤6和步骤7具体为:
①计算节点从描述符文件中解析出待匹配描述符特征向量,并进行Hash映射,得到待匹配Hash位串;各计算节点找同一个待匹配Hash位串x与加载到自身的所有样本位串逐一进行汉明比较,找到汉明距离最短的样本位串A,并汇总到调度处理集群进行整体排序,调度处理集群根据汇总数据找到与待匹配Hash位串x汉明距离最短的样本位串A’,如果样本位串A’与待匹配位串x的汉明距离小于或等于预设的全局阈值,则将该样本位串A’记为一个匹配点;
②针对每个待匹配Hash位串均进行上述操作,然后调度处理集群针对每个样本图像,计算匹配点占该样本图像的样本位串的比例,比例最高的样本图像就是匹配图像;
③将匹配图像的信息返回给所述终端。
4.如权利要求1所述的方法,其特征在于,所述步骤6和步骤7具体为:
①每个计算节点从描述符文件中解析出待匹配描述符特征向量,并进行Hash映射,得到待匹配Hash位串;以样本图像为单位,用待匹配Hash位串逐个与单个样本图像的所有样本位串进行汉明比较,统计匹配率,即匹配成功的样本位串占单个样本图像的所有样本位串的比例,将匹配率汇总到调度处理集群;
②调度处理集群从所有计算节点反馈的匹配率中的寻找最大匹配率,最大匹配率对应的样本图像就是匹配图像;
③将匹配图像的信息返回给所述终端。
5.如权利要求1或3所述的方法,其特征在于,采用结构化存储方式存储样本位串,每个样本位串对应一条记录;每个记录的字段包括索引ID、样本图像ID、GPS信息、样本位串序号、样本位串;
进一步在样本文件系统中存储索引表,该索引表记载了GPS信息与记录存储位置的索引关系;
所述步骤5中为待识别图像加载相关的样本位串时,根据GPS信息查找根据索引表,将GPS信息在所述圆形区域内的记录内容加载到各个计算节点中。
6.如权利要求1所述的方法,其特征在于,每个计算节点中开辟多个并行计算线程,每个线程承担相同的任务量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210292376.5/1.html,转载请声明来源钻瓜专利网。