[发明专利]一种基于双目视觉的串联通道融合行人检测方法在审
申请号: | 201810269304.6 | 申请日: | 2018-03-29 |
公开(公告)号: | CN108596040A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 赖剑煌;陆瑞智;谢晓华 | 申请(专利权)人: | 中山大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06T7/80 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 刘巧霞 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视差图 卷积神经网络 行人检测 串联 双目视觉 非极大值抑制 互补关系 检测结果 行人位置 颜色信息 融合 不变性 彩色图 构建 鲁棒 双目 光照 输出 预测 联合 学习 | ||
1.一种基于双目视觉的串联通道融合行人检测方法,其特征在于,包括步骤:根据双目RGB图像生成视差图,构建一个卷积神经网络,把RGB图像通道和视差图通道串联作为卷积神经网络的输入,学习RGB图和视差图之间的互补关系,从卷积神经网络输出的检测结果中挑选出预测值大于设定值的部分,对该部分进行非极大值抑制,得到最终行人位置。
2.根据权利要求1所述的基于双目视觉的串联通道融合行人检测方法,其特征在于,所述基于双目视觉的串联通道融合行人检测方法还包括双目相机标定预处理步骤,该步骤是:
(1-1)制作一个Z×Z的黑白棋盘格,用双目相机从不同角度拍摄该棋盘格M组照片,拍摄时棋盘格必须同时完整地出现在左右两个摄像头的视野中;
(1-2)根据标定拍摄到的M组照片,用Matlab的标定工具包TOOLBOX_calib进行相机的标定,最终得到左右摄像头x方向和y方向的焦距左右摄像头的成像中心坐标左右摄像头的畸变参数d′1,d′2,以及左右摄像头之间的旋转矩阵R和平移向量T。
3.根据权利要求2所述的基于双目视觉的串联通道融合行人检测方法,其特征在于,所述基于双目视觉的串联通道融合行人检测方法还包括双目图像获取与校正步骤,该步骤是:
输入双目相机拍摄得到的两张图片I1,I2,根据双目相机标定预处理步骤得到的d′1,d′2,R,T,用opencv的stereoRectify函数进行图片校正,得到校正后的图片
4.根据权利要求1所述的基于双目视觉的串联通道融合行人检测方法,其特征在于,根据双目RGB图像生成视差图的步骤是:
输入两张校正后的图片根据SGBM算法生成视差图d,视差图d是一个单通道灰度图,灰度值为0-255;视差图记录着对于图片上每一点,左图和右图位置的偏差量。
5.根据权利要求1所述的基于双目视觉的串联通道融合行人检测方法,其特征在于,所述构建卷积神经网络的步骤是:
构建一个包含19个卷积层,15个激活层和5个抽取层的卷积神经网络;
卷积神经网络连接关系为:卷积层1-激活层1-卷积层2-激活层2-抽取层1-卷积层3-激活层3-卷积层4-激活层4-抽取层2-卷积层5-激活层5-卷积层6-激活层6-卷积层7-激活层7-抽取层3-卷积层8-激活层8-卷积层9-激活层9-卷积层10-激活层10-抽取层4-卷积层11-激活层11-卷积层12-激活层12-卷积层13-激活层13-抽取层5-卷积层14-激活层14-卷积层15-激活层15,激活层10-卷积层16,激活层10-卷积层17,激活层15-卷积层18,激活层15-卷积层19;
把RGB图像通道和视差图通道串联作为卷积神经网络的输入,经过前向传播计算后,输出每个检测候选框的左上角横坐标、纵坐标、宽、高,每个检测候选框内存在行人的概率。
6.根据权利要求1所述的基于双目视觉的串联通道融合行人检测方法,其特征在于,所述进行非极大值抑制的步骤是:
设预测值大于设定值的部分为
初始化:令
a)从中挑选出存在行人概率最大的候选框Bmax,查找中除了Bmax以外,其它与Bmax交并比超过P的候选框,组成若不是空集,则将中的候选框从中剔除;
b)将Bmax从中剔除,同时将Bmax加入中,若不为空集,则执行步骤a),否则执行步骤c);
c)即最终行人的检测结果,其中k=1,…,K,K<=N。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810269304.6/1.html,转载请声明来源钻瓜专利网。