[发明专利]基于非局部信息注意力机制的交叉视角地理定位方法在审
申请号: | 202211700267.2 | 申请日: | 2022-12-28 |
公开(公告)号: | CN115984539A | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 薛轶天;张强;颜成钢;王廷宇;高宇涵;孙垚棋;陈楚翘;王鸿奎;朱尊杰;殷海兵;张继勇;李宗鹏;赵治栋 | 申请(专利权)人: | 杭电(丽水)研究院有限公司 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/26;G06V10/74;G06V10/764;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 323010 浙江省丽水市莲都区南明山*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 局部 信息 注意力 机制 交叉 视角 地理 定位 方法 | ||
本发明公开了基于非局部信息注意力机制的交叉视角地理定位方法。将非局部信息的注意力机制应用到交叉视角地理定位任务中。通过非局部信息的注意力机制模型融合全局信息,结合上下文的特征信息,缓解局部特征在训练中视野不够大、部分信息丢失、关键特征抓取不准等问题。并且在一定程度上改善了交叉视角地理定位任务中同一地理建筑不同视角特征分布差异较大的问题,优化训练模型,从而提高匹配检索和分类的准确率以及效率,并且非局部信息的注意力机制可以很方便地嵌入到很多现有模型中,进一步提高模型性能。
技术领域
本发明属于交叉视角的地理定位领域,具体涉及基于非局部信息注意力机制的交叉视角地理定位方法,将不同视角的地理目标图片进行匹配检索,引申为定位和导航问题。
背景技术
随着时代的演进,多视角地理定位技术的市场需求越来越大,将交叉视角匹配问题应用于定位和导航方面也受到越来越多的重视,即从不同的视角图像中检索出对应地理目标。如今,这方面的研究已经被慢慢应用到无人驾驶、无人机配送、机器人运输、自主巡检等领域。交叉地理定位是指从不同视点的图像推断地理位置,一般被视为图像检索任务。通常,在给定一个无人机视角图像后,实现从卫星的候选图像库中找出同一目标物的图像,从而我们可以利用卫星图中带有的相关信息,结合目前已有的定位技术,实现导航等功能。此外,当GPS信号相对较弱或不稳定的时候,可以借助其实现一个独立的辅助工具来帮助用户定位。随着深度学习技术的成熟,该技术在计算机视领域被广泛应用,神经网络被引入到交叉视角地理定位中。因此,模型的性能也得到了较大提升。例如,可以利用一个已经经过预训练的神经网络模型,提取交叉视角地理图片的相关特征,通过训练,提取相关语义信息,保留重要特征。因此,研究人员可以通过提取图片中地理目标丰富的语义信息,实现多视角图片的匹配,最终完成地点目标的检索任务。在提取特征的过程中,既要关注局部信息,又要保留全局信息,结合上下文语义信息后有助于提高检索分类的性能。
非局部信息的注意力机制目前被广泛应用到神经网络机器学习中,并在很多场景下取得了不错的效果。将视觉注意力机制应用到深度学习的研究工作,目前常常使用掩码(Mask)来形成注意力机制。掩码的目的是得到一层新的权重,计算相似度,从而提取出图片信息中的关键信息,这些关键信息往往是对其性能提升是至关重要的。通过模型训练,提取出图片中要重点关注的相关区域,即注意力机制。在一些场景下,捕获长范围特征依赖需要累积很多层的网络,这样会降低学习的效率。并且如果网络较深,需要小心地设计模块和梯度。非局部操作计算效率很高,为了达到同等效果,往往只需要更少的堆叠层。非局部操作可以保证输入尺度和输出尺度不变,并且这种设计可以很容易嵌入到目前的网络架构中。计算图片相似度、提取关键信息的方法也各有不同,因而得到的非局部注意力机制性能效果也各不相同。在具体方案中,要尽可能利用上下文信息,并提高模型的鲁棒性。
如今,生活节奏越来越快。人们对快递、外卖配送效率的要求也慢慢提高,这些行业需要尽可能提高配送效率。而在配送的过程中,就需要提升无人化水平,然而无人化配送必然会对地理地位导航技术带来高标准要求。无人机技术目前呈快速发展的趋势,与地理定位技术加强融合,将有着很大的研究空间和应用市场。比如在疫情的大背景下,可以利用无人机和机器人进行无接触配送,大大降低感染的风险。在救灾方面,利用无人配送也将会大大提高救灾的效率,实现点对点精准物资救援,这样也在一定程度上降低了救灾人员在救援过程中存在的风险。但在交叉视角地理地位任务中,卫星图、无人机图视角差异较大,在神经网络下学出的特征分布差异也较大,有时不能很好完成检索分类任务。目前该领域的研究方法也很多,有一些方法采用很深的网络,这样会大大降低学习的效率,不利于产品落地。还有一些方法过于关注局部信息,而忽略了许多有用的上下文信息,视野受到限制,从而准确率有待进一步提高,模型性能还有一定的提升空间。同样,在不同视角图片的匹配过程中,还存在着一些信息不对齐的现象,这样不利于建筑的检索。
发明内容
针对现有技术中存在的不足,本发明提供基于非局部信息注意力机制的交叉视角地理定位方法
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭电(丽水)研究院有限公司,未经杭电(丽水)研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211700267.2/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置