[发明专利]基于多尺度自适应融合的RGB-D显著目标检测方法在审
申请号: | 202211426843.9 | 申请日: | 2022-11-15 |
公开(公告)号: | CN115690516A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 孔雨秋;王鹤 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06N3/0464;G06N3/08;G06V10/77;G06V10/80;G06V10/82 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 戴风友 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 自适应 融合 rgb 显著 目标 检测 方法 | ||
1.基于多尺度自适应融合的RGB-D显著目标检测方法,其特征在于,步骤如下:
步骤S1:数据预处理;根据输入的图像组,利用双流网络分别提取两个模态的多尺度特征;图像组包括RGB图像和深度图像;
步骤S2:采取尺度自适应融合编码器,根据跨模态的多尺度属性整合其层次特征;
步骤S3:融合多尺度特征,生成预测的显著目标图;
步骤S4:根据损失函数训练整个算法,使算法预测结果拟合正确结果;
步骤S5:利用训练集对RGB-D显著目标检测模型进行训练,并利用验证集对正在训练的模型进行验证,所得的整个算法模型即为RGB-D显著目标检测的工具。
2.如权利要求1所述的基于多尺度自适应融合的RGB-D显著目标检测方法,其特征在于,所述步骤S1,具体为:
步骤S11:将输入的RGB图像与对应的深度图像,利用VGG-16作为骨干网结合部分解码器,分别独立提取多层次特征;
步骤S12:利用整体注意力模块处理来自优化层的特征图和初始显著图,精确边缘信息,均匀地分割整个对象;
步骤S13:输出RGB图像与对应的深度图像的初步预测图。
3.如权利要求1或2所述的基于多尺度自适应融合的RGB-D显著目标检测方法,其特征在于,所述步骤S2,具体为:
步骤S21:对于浅尺度特征,基于PointNet++方法实现特征提取,在3D点云空间中学习特征表示;
步骤S22:对于中尺度特征,设计空间对比精细化模块,通过挖掘空间对比信息,精确整合多模态特征;
步骤S23:对于深尺度特征,利用深度感知通道注意力,自适应地增强RGB-D模态下的语义线索表征能力。
4.如权利要求1或2所述的基于多尺度自适应融合的RGB-D显著目标检测方法,其特征在于,所述步骤S3,具体为:
步骤S31:融合多尺度特征;
步骤S32:将融合后的特征与RGB显著预测图、深度显著预测图整合;
步骤S33:输出最终预测的显著目标特征图,使用图像真值作为监督。
5.如权利要求3所述的基于多尺度自适应融合的RGB-D显著目标检测方法,其特征在于,所述步骤S3,具体为:
步骤S31:融合多尺度特征;
步骤S32:将融合后的特征与RGB显著预测图、深度显著预测图整合;
步骤S33:输出最终预测的显著目标特征图,使用图像真值作为监督。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211426843.9/1.html,转载请声明来源钻瓜专利网。