[发明专利]基于Faster-RCNN物体空间区分方法、装置、计算机设备及存储介质有效
申请号: | 202210082954.6 | 申请日: | 2022-01-25 |
公开(公告)号: | CN114120160B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 姜帝兆;郑义;李骥东 | 申请(专利权)人: | 成都合能创越软件有限公司 |
主分类号: | G06V20/20 | 分类号: | G06V20/20;G06V10/75;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京卓恒知识产权代理事务所(特殊普通合伙) 11394 | 代理人: | 孔鹏 |
地址: | 610000 四川省成都市高新区天*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 faster rcnn 物体 空间 区分 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及图像处理技术领域,具体而言,涉及基于Faster‑RCNN物体空间区分方法、装置、计算机设备及存储介质;该方法包括:获取待识别图像;针对待识别图像,通过Faster‑RCNN目标区域推荐网络获得多个感兴趣区域;获取独立感兴趣区域的参量;通过参量生成高斯热图,基于高斯热图作为掩膜,通过点乘所述特征图得到环境热图;对环境热图进行池化,得到特征热图,基于特征热图得到特征向量;生成类别向量,将类别向量与所述特征向量进行拼接,得到目标向量;对目标向量进行回归处理,得到物体‑环境匹配值;基于物体‑环境匹配值进行物体环境的区分;本发明能有效克服被识别物体与预设场景不符的情况,增加了对于物体识别的准确度。
技术领域
本申请涉及图像处理技术领域,具体而言,涉及基于Faster-RCNN物体空间区分方法、装置、计算机设备及存储介质。
背景技术
物体检测(object detection):它是计算机视觉中的经典问题之一,其任务是用框去标出图像中物体的位置,并给出物体的类别和置信度。上下文感知(contextawareness):它是一种在信息系统中,结合物体周边环境一起推理的能力。
目前针对于基于环境的物体检测的方法包含两种,一种方案是基于多个单纯的物体检测模型,一个模型识别物体,另一个识别场景。当被识别物体处于不符合要求的场景时,不输出结果。另一种方案是,一个模型识别物体,另一个模型对全场景进行语义分割。当被识别物体处于不符合要求的场景时,不上报结果。
利用多个检测模型的方案,只能对大小、长宽比例合适的“场景”进行检测,例如一辆卡车上运输的纸箱:模型检测出纸箱,另一模型检测出卡车,若规定卡车上的纸箱不属于被检测的类型,则不输出结果。但对于形状不规则,大小比例不适合物体检测模型识别的“场景”时,如天空、湖泊,街道等,此方法无效,会将路灯误认为井盖。
针对于这样的问题,现有技术中常使用利用语义分割的方法理论上能解决上述问题。但由于效果较好的语义分割模型,都使用了较高的分辨率,边缘端设备由于性能限制无法使用。同时,由于被识别物体的场景多样,语义分割模型无法包含所有的背景类别,模型也无法推理出待识别物体与环境的关系,最后的输出结果需要依据两个模型的结果人为地进行逻辑判断,缺乏灵活性。
发明内容
本申请实施例提供一种基于Faster-RCNN物体环境区分方法、装置、计算机设备及其存储介质,该方法在数据标注的时候需要除了要提供被识别物体的位置、类别信息外,还要求提供该物体周围的场景与该物体是否匹配的标签。
为了达到上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供了一种基于Faster-RCNN物体环境区分方法,该方法包括:获取待识别图像;针对待识别图像,通过Faster-RCNN目标区域推荐网络获得多个感兴趣区域;获取独立感兴趣区域的参量;通过参量生成高斯热图,其中热图与特征图大小相同;高斯热图作为掩膜,通过点乘所述特征图得到环境热图;对环境热图进行池化,得到特征热图,基于特征热图得到特征向量;基于Faster-RCNN识别结果回归层生成类别向量,将类别向量与所述特征向量进行拼接,得到目标向量;对目标向量进行回归处理,得到物体-环境匹配值;基于物体-环境匹配值进行物体环境的区分。
进一步地,参量包括所述感兴趣区域的中心位置坐标及宽度和高度。
进一步地,环境热图池化处理在Faster-RCNN感兴趣区域池化层中进行。
进一步地,对环境热图进行池化处理后,得到特征热图,并对特征热图进行调整,调整为1维向量,得到特征向量。
进一步地,类别向量通过Faster-RCNN全连接层与softmax函数生成。
进一步地,类别向量拼接至特征向量的数据后部,形成目标向量。
进一步地,物体-环境匹配值的获得通过以下方式:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都合能创越软件有限公司,未经成都合能创越软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210082954.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电能表串表识别方法、装置及电子设备
- 下一篇:一种微动台及运动装置