[发明专利]一种重构引导下的复杂场景的目标检测方法及装置在审
申请号: | 202110582140.4 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113343807A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 何福金;吴子丰;俞益洲;李一鸣;乔昕 | 申请(专利权)人: | 北京深睿博联科技有限责任公司;杭州深睿博联科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/40;G06K9/46;G06K9/62;G06T9/00;G06N3/04;G06N3/08 |
代理公司: | 北京天方智力知识产权代理事务所(普通合伙) 11719 | 代理人: | 路远 |
地址: | 102209 北京市昌平区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 引导 复杂 场景 目标 检测 方法 装置 | ||
本申请公开了一种重构引导下的复杂场景的目标检测方法及装置,该方法中对输入图像进行加噪处理得到加噪后图像,对加噪后图像进行编码,提取加噪后图像的第一多尺度图像特征,对输入图像进行编码,提取输入图像的第二多尺度图像特征,将第二多尺度图像特征作为第一多尺度图像特征的监督信息,对第一多尺度图像特征进行解码得到重构图像,提取重构图像的图像特征,对所提取的图像特征和第一多尺度图像特征进行融合得到融合特征,根据融合特征和预设目标检测模型进行目标检测得到目标对象。本申请中,以输入图像作为输入以减少重构图像的误差为目的来从复杂场景的图像中提取图像的本质特征并进行目标检测,提高识别出的物体的准确性为导盲提供依据。
技术领域
本申请涉及目标检测技术领域,尤其涉及一种重构引导下的复杂场景的目标检测方法及装置。
背景技术
近年来,随着计算机视觉研究的快速发展,越来越多的人尝试使用计算机视觉手段来帮助盲人理解这个世界,例如导盲眼镜,通过导盲眼镜以计算机视觉的方式来帮助盲人了解周围的人或者物。
导盲的主要作用就是识别周围的环境,其中包括检测周围的人、障碍物、红绿灯、车辆等相关信息,并将这些信息以声音或者其它的方式呈现给盲人。因此识别室外场景中盲人周围环境中的物体是导盲的第一步。而室外场景通常是复杂的,其中一个很重要的因素就是天气,不同的天气会使得摄像头采集到不一样的信息,例如摄像头采集到的图像带有雨、雾、光照等的影响,这些因素将限制检测器的性能,使得从图像中识别出的物体不够准确,导致后续无法准确的为导盲提供依据。
针对上述雨、雾、低光照的复杂场景下的物体检测不够准确的问题目前有如下几种解决方式:
(1)需要额外的预处理操作。例如:利用一个预处理的网络对图像进行去雨、去雾、图像增强等操作,这通常需要额外的计算时间和资源来完成。并且经过这种预处理操作可能会改变图像的分布,导致并不能很好的直接应用到后续的目标检测中,而两者连调又存在比较大的不稳定性,且过程比较繁琐。
(2)利用红外信息来补充复杂场景下的信息。红外图像可以不受雨雾等一些因素的干扰,但是红外图像通常是不准确,缺少一些纹理相关的信息,并且红外图像和自然图像之间并不是完全的一一对应关系,所以如何融合两者之间的信息是一个需要考量的问题,并且红外图像需要额外的摄像头来获取,这也一定程度的增加了成本。
(3)利用深度图来辅助提高检测模型的性能。深度图的引入有利于检测模型对于空间的结构信息进行理解,但这两个模态的东西本质上是不一样的,自然图像提供了纹理,亮度等信息,而深度图更多的是体提供了一种空间结构信息,将两者结合可以有效的将二维图像向三位转换,但需要研究它们之间的融合策略,并且深度图在一些复杂场景中是比较难获取的。因此训练比较麻烦。
可见,上述几种方式在目标检测时均无法较好的对抗天气的影响,使得从具有复杂场景的图像中识别出的物体不够准确,导致后续无法准确的为导盲提供依据。
发明内容
本申请提供一种重构引导下的复杂场景的目标检测方法及装置,可以对抗天气的影响,提高从具有复杂场景的图像中识别出的物体的准确性,进一步准确的为导盲提供依据。
第一方面,本申请提供了一种重构引导下的复杂场景的目标检测方法,包括:
对输入图像进行加噪处理得到加噪后图像,其中,所述输入图像为无噪声图像;
对所述加噪后图像进行编码,提取所述加噪后图像的第一多尺度图像特征;
对所述输入图像进行编码,提取所述输入图像的第二多尺度图像特征;
将所述第二多尺度图像特征作为所述第一多尺度图像特征的监督信息,对所述第一多尺度图像特征进行解码得到重构图像,其中,所述重构图像与所述输入图像之间的相似度大于预设阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京深睿博联科技有限责任公司;杭州深睿博联科技有限公司,未经北京深睿博联科技有限责任公司;杭州深睿博联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110582140.4/2.html,转载请声明来源钻瓜专利网。