[发明专利]基于深度学习算子的立体匹配方法和系统有效
申请号: | 202210359320.0 | 申请日: | 2022-04-07 |
公开(公告)号: | CN114445473B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 葛方海;杨超;刘永才;孙钊;王鹏 | 申请(专利权)人: | 北京中科慧眼科技有限公司 |
主分类号: | G06T7/33 | 分类号: | G06T7/33;G06T7/593;H04N13/178;G06N3/08;G06K9/62;G06V10/74;G06V10/82 |
代理公司: | 北京远立知识产权代理事务所(普通合伙) 11502 | 代理人: | 李海燕 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 算子 立体 匹配 方法 系统 | ||
本发明公开了一种基于深度学习算子的立体匹配方法和系统,所述方法包括:获取目标区域的左右视图;使用卷积核对左右视图进行视差匹配代价计算,以得到匹配代价值;基于得到的匹配代价值,使用深度学习算子沿多个方向进行匹配代价聚合,以得到聚合代价值;基于赢家通吃算法,得到具有最大代价值的整像素视差结果;根据拟合算法对整像素视差结果进行亚像素视差计算,以得到目标视差值。该方法和系统提高了立体匹配方法的精度和泛化能力。
技术领域
本申请实施例涉及自动驾驶技术领域,具体涉及一种基于深度学习算子的立体匹配方法和系统。
背景技术
随着人们对更加安全和便捷出行的需求的日益增长,智能驾驶技术正处于蓬勃发展时期,感知和理解环境的能力是汽车智能系统的基础和前提。智能车辆通过双目相机采集视图,并在感知周围环境后做出分析,通过将信息提供给控制系统,实现对路面情况的检测。同时,双目相机的立体匹配精度和泛化能力,直接影响数据采集的准确性。
因此,提供一种基于深度学习算子的立体匹配方法和系统,以提高立体匹配方法的精度和泛化能力,从而保证自动驾驶过程中的数据采集准确性,就成本领域技术人员亟待解决的问题。
发明内容
为此,本发明提供一种基于深度学习算子的立体匹配方法和系统,以提高立体匹配方法的精度和泛化能力,从而保证自动驾驶过程中的数据采集准确性。
为了实现上述目的,本申请实施例提供如下技术方案:
一种基于深度学习算子的立体匹配方法,所述方法包括:
获取目标区域的左右视图;
使用卷积核对左右视图进行视差匹配代价计算,以得到匹配代价值;
基于得到的匹配代价值,使用深度学习算子沿多个方向进行匹配代价聚合,以得到聚合代价值;
基于赢家通吃算法,得到具有最大代价值的整像素视差结果;
根据拟合算法对整像素视差结果进行亚像素视差计算,以得到目标视差值。
进一步地,使用卷积核对左右视图进行视差匹配代价计算,以得到匹配代价值,具体包括:
使用第一Sobel算子对左右视图进行卷积,使用第二Sobel算子对左右视图进行卷积,所述第一Sobel算子和所述第二Sobel算子的大小不同,以便在卷积后得到两种不同的梯度信息;
计算左图对应右图的边缘结构相似值,并计算右图对应左图的边缘结构相似性;
计算和的最小值为当前点时,当前视差的匹配代价结果。
进一步地,计算左图对应右图的边缘结构相似值,具体包括:
计算左图中左图目标像素点 基于所述第一Sobel算子得到的结果、基于所述第二Sobel算子得到的结果,以及所述左图目标像素点p左边相邻像素点基于所述第一Sobel算子结果;
取、和中的最大值和最小值,并计算右图目标像素点基于所述第一Sobel算子的,其中,所述右图目标像素点为所述左图目标像素点在右图中的对应像素点,且p和之间的视差为d;
计算和中的最大值,并以作为左图对应右图中的边缘结构相似性。
进一步地,利用以下公式,进行匹配代价聚合:
其中,表示在传播方向上像素点在视差的聚合代价值,表示传播方向, 表示像素点在视差的匹配代价值,表示在r传播方向上p像素点的前一个像素点所有视差的聚合代价,表示不同视差所对用的惩罚项。
进一步地,利用以下公式,对整像素视差结果进行亚像素视差计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科慧眼科技有限公司,未经北京中科慧眼科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210359320.0/2.html,转载请声明来源钻瓜专利网。