[发明专利]基于深度学习的司机驾驶行为检测与识别方法在审
申请号: | 202110343377.7 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113128360A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 蔡沈健;倪成润;黄鹤;张强;沈纲祥 | 申请(专利权)人: | 苏州乐达纳米科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 郭磊 |
地址: | 215000 江苏省苏州市工业园*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 司机 驾驶 行为 检测 识别 方法 | ||
1.一种基于深度学习的司机驾驶行为检测与识别方法,其特征在于,包括:
步骤1.获取司机在驾驶过程中的视频帧序列,所述视频帧序列包括司机在驾驶过程中的行为图像;
步骤2.对所述视频帧序列进行预处理;
步骤3.构建由ResNet-18、多层LSTM网络和全连接层级联组成的深度学习模型,利用所述深度学习模型对预处理后的视频帧序列进行检测和识别。
2.如权利要求1所述的基于深度学习的司机驾驶行为检测与识别方法,其特征在于,所述ResNet-18网络由五部分组成,第一部分由卷积网络和最大池化层组成;下面四部分为结构相同的卷积网络,每部分有四层卷积层,每部分的输出通道数依次翻倍;每两层卷积层的输入与输出进行直接相加,成为残差模块,所述残差模块的输入通道数与输出通道数应与该部分特征图的输入输出通道数分别对应。
3.如权利要求2所述的基于深度学习的司机驾驶行为检测与识别方法,其特征在于,所述ResNet-18网络用于提取所述视频帧序列的空间特征,在所述ResNet-18网络的每个残差模块中都加入了卷积注意模块,所述卷积注意模块分别在通道上和空间上对特征图进行加权处理。
4.如权利要求3所述的基于深度学习的司机驾驶行为检测与识别方法,其特征在于,所述通道卷积注意模块在通道上的输入是一个H×W×C的特征F,先对输入的每个通道特征分别进行全局平均池化和最大池化操作得到两个1×1×C的通道描述;接着,再将两个1×1×C的通道描述分别送入一个两层的卷积神经网络,第一层神经元个数为C/r,r为缩放因子,激活函数为ReLU,第二层神经元个数为C,然后将得到的两个特征相加经过Sigmoid非线性函数映射得到维度为C,值为0-1之间的权重向量Mc,每个向量元素值反应了该通道的重要程度,将原来的特征F乘以权重系数得到缩放后的特征;Mc的计算公式为:
其中,A为全局平均池化操作,M为最大池化操作,G为卷积操作,W0是第一层卷积层权值,第一层卷积操作后接ReLU激活函数,W1为第二层卷积操作权值,σ是Sigmoid函数。
5.如权利要求3所述的基于深度学习的司机驾驶行为检测与识别方法,其特征在于,所述空间卷积注意模块在空间上的输入是一个H×W×C的特征F,对通道分别进行最大池化和平均池化操作,得到两个H×W×1的空间描述,将两个矩阵在通道上级联,即矩阵在最后一个维度上进行叠加,通过一个7x7的卷积和Sigmoid函数得到值分布在0-1之间的空间特征权重系数Ms,每个元素值代表对应区域特征的重要性,并与特征图相乘;Ms的计算公式为:
其中,A是平均池化操作,M是最大池化操作,f7x7是卷积核大小为7x7的卷积操作,分别是经过平均池化和最大池化后得到的特征矩阵,σ是Sigmoid函数。
6.如权利要求1所述的基于深度学习的司机驾驶行为检测与识别方法,其特征在于,所述LSTM网络用于提取所述视频帧序列的时序信息,所述LSTM网络有三层,每层LSTM输入都要经过时序注意力模块,对时序采取系数加权的处理办法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州乐达纳米科技有限公司,未经苏州乐达纳米科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110343377.7/1.html,转载请声明来源钻瓜专利网。