[发明专利]一种基于无人机俯拍视频与神经网络的铁路轨道分割方法在审
申请号: | 202211662359.6 | 申请日: | 2022-12-23 |
公开(公告)号: | CN115965784A | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 李晓峰;杨晗;郭玉新;贾利民 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/82;G06V20/17;G06V20/40 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 黄晓军 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 无人机 俯拍 视频 神经网络 铁路 轨道 分割 方法 | ||
1.一种基于无人机俯拍视频与神经网络的铁路轨道分割方法,其特征在于,包括:
将当前视频帧图像和上一帧检测结果图像进行连接,将连接图像作为轻量级编解码分割网络的输入图像;
所述轻量级编解码分割网络通过下采样提取输入图像的两个特征图像,将所述两个特征图像分别通过空洞空间金字塔池化网络和分裂-递归-合并模块得到两个特征图;
通过注意力机制模块将所述两个特征图连接起来,再通过上采样处理得到表示铁路轨道线路的输出掩码。
2.根据权利要求1所述的方法,其特征在于,所述的将当前视频帧图像和上一帧检测结果图像进行连接,将连接图像作为轻量级编解码分割网络的输入图像,包括:
通过无人机连续俯拍轨道线路的视频数据,将视频数据分割成连续的多帧轨道线路图像;
将当前帧的3通道的轨道线路图像It和上一帧的1通道的轨道检测结果的灰度图像进行连接,得到一个4通道的连接图像将该连接图像作为轻量级编解码分割网络的主干网络的输入图像。
3.根据权利要求1所述的方法,其特征在于,所述的轻量级编解码分割网络通过下采样提取输入图像的两个特征图像,包括:
所述轻量级编解码分割网络的主干网络提取所述连接图像的两个特征图像X1是输入图像经过4次2倍下采样后得到的长宽尺寸均为输入尺寸1/16的高层特征,X2是输入图像经过3次2倍下采样后得到的长宽尺寸均为输入尺寸1/8的低层特征。
4.根据权利要求1所述的方法,其特征在于,所述的将所述两个特征图像分别通过空洞空间金字塔池化网络和分裂-递归-合并模块得到两个特征图,包括:
将特征图像X1通过空洞空间金字塔池化模块获得特征图Y1=ASPP(X1),将特征图像X2通过一个递归结构分裂-递归-合并SRM(Split-Recursion-Merge模块获得特征图Y2=SRM(X2);
所述SRM模块的处理过程如下:
(1)分裂,基于图像样本中铁路线的方向,将尺寸大小为c×h×w的特征图像X2按行或按列拆分为多个子特征图{xi}=(x1,x2,…,xh);
(2)递归,以xi作为输入,从两个方向进行递归卷积,输出相同数量的子特征图{yi}=(y1,y2,…,yh);
递归运算表示为式(1)(2)(3):
式中表示卷积运算,子特征图和的大小为c×1×w,K2和K3是大小为1×kc的卷积核,K1是大小为kc×kc的卷积核,kc=3,f(·)为ReLU激活函数,和分别为两个方向的中间递归结果;
(3)合并,将yi合并为一个完整的输出特征图Y2。
5.根据权利要求所述的方法,其特征在于,所述的通过注意力机制模块将所述两个特征图连接起来,再通过上采样处理得到表示铁路轨道线路的输出掩码,包括:
在解码器网络中,通过4次上采样,将特征图Y1与特征图Y2连接起来,再通过4次上采样,得到输出掩码M=Decoder(Y1,Y2),输出掩码M与输入图像具有相同的宽度和高度,使用注意力机制模块CBAM过滤输出掩码M中的背景与噪声,使用过滤后的输出掩码M表示铁路轨道线路。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述的方法还包括:
使用静态图像和失真掩模作为输入来训练铁路轨道分割网络模型的参数,离线训练中对训练集中的所有铁路轨道分割实例对象掩膜进行缩放、旋转、平移和压缩的形变操作;
在线训练以包含铁路对象实例的特定特征的连续的多帧图像作为输入,来微调铁路轨道分割网络模型的参数,在线训练中,训练样本中每设定个连续帧被划分为一组,从每组的第二帧开始训练,并将前一帧的检测结果作为掩模输入的附加信道。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211662359.6/1.html,转载请声明来源钻瓜专利网。