[发明专利]网络训练方法、增量建图方法、定位方法、装置及设备在审
| 申请号: | 201811539138.3 | 申请日: | 2018-12-14 |
| 公开(公告)号: | CN109658445A | 公开(公告)日: | 2019-04-19 |
| 发明(设计)人: | 王金戈;吴琅;李北辰;贺一家;刘骁 | 申请(专利权)人: | 北京旷视科技有限公司 |
| 主分类号: | G06T7/33 | 分类号: | G06T7/33;G06T7/50;G06T7/70;G06K9/62;G06K9/00;G06N3/08 |
| 代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 范彦扬 |
| 地址: | 100000 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 场景识别 图像集合 训练样本 图像 装置及设备 网络训练 损失函数 收敛 低端处理器 共享参数 神经网络 实时运行 视觉定位 网络包括 网络 哈希 | ||
本发明提供了一种网络训练方法、增量建图方法、定位方法、装置及设备,涉及视觉定位技术领域,该方法包括:获取训练样本,训练样本中第一图像集合中的图像和第二图像集合中的图像为相似的图像,第一图像集合中的图像和第三图像集合中的图像为不相似的图像;将训练样本输入场景识别网络,场景识别网络包括三个结构相同且共享参数的基于深度哈希的轻量级神经网络;使用训练样本对场景识别网络进行训练,直至损失函数收敛,将损失函数收敛时对应的参数作为场景识别网络的参数。本发明实施例提供的网络训练方法、增量建图方法、定位方法、装置及设备,能够在低端处理器上实时运行,降低了对硬件的依赖程度。
技术领域
本发明涉及视觉定位技术领域,尤其是涉及一种网络训练方法、增量建图方法、定位方法、装置及设备。
背景技术
视觉定位是机器人、无人机、自动驾驶汽车、增强现实中普遍应用的关键技术,采用相机作为传感器,通过分析采集的图像,与预先建立的环境地图或实时构建的地图相比较,进而确定出准确的相机位置和姿态。视觉定位主要方式包括:同时定位与地图构建(Simultaneous Localization And Mapping,SLAM)和视觉重定位。
其中,SLAM同时估计准确的相机位姿和路标点空间位置,但由于算法复杂度较高,待优化变量过多,导致计算代价较高,很难在计算性能较弱的移动端设备上运行,且计算量容易随着场景增大而增大,无法适用于大场景定位。视觉重定位是一种将地图构建与定位分离开的方法,预先通过复杂的算法和技术手段建立尽量精确的环境地图,定位时只需要将当前图像与地图中的点云进行配准,优化相机位姿即可。但视觉重定位要求事先建立准确的地图,采用运动恢复结构等方法虽然可以得到准确的地图,但在大规模场景下计算量仍然是无法承受的。另一方面,直接将图像与地图进行配准是一种不可取的方案,当场景较大时地图的大小很可能会超出计算机的内存容量,并且在没有任何先验信息的情况下将图像与地图进行匹配会耗费大量时间。
针对上述视觉定位方式存在的硬件需求高、计算量大且耗时的问题,目前还未提出有效解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种网络训练方法、增量建图方法、定位方法、装置及设备,可以降低对硬件的依赖且实时运行。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种场景识别网络的训练方法,包括:获取训练样本,所述训练样本包括对象的第一图像集合、第二图像集合和第三图像集合,所述第一图像集合中的图像和所述第二图像集合中的图像为相似的图像,所述第一图像集合中的图像和所述第三图像集合中的图像为不相似的图像;将所述训练样本输入至场景识别网络,所述场景识别网络包括三个特征提取网络,三个所述特征提取网络均为基于深度哈希的轻量级神经网络,三个所述特征提取网络的网络结构相同并且共享参数;所述场景识别网络的损失函数为包括相似度分级的损失函数;使用所述训练样本对所述场景识别网络进行训练,直至所述损失函数收敛,将所述损失函数收敛时对应的参数作为所述场景识别网络的参数。
进一步,所述特征提取网络为MobileNet、ShuffleNet、SqueezeNet或Xception。
进一步,所述损失函数为:
J=J1+J2
其中,
J1=max(0,dqp-dqn+(margin-β×similarity))+max(0,dqp-dpn+(margin-β×similarity))+max(0,dqp-β×similarity-1)+max(0,β×similarity-dqp);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811539138.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





