[发明专利]一种基于Video Transformer的疲劳驾驶检测方法有效
申请号: | 202210366039.X | 申请日: | 2022-04-08 |
公开(公告)号: | CN114821713B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 刘玉玲;陈龙 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V20/59;G06V20/40;G06N3/0464;G06N3/08;G06V10/82 |
代理公司: | 北京圣州专利代理事务所(普通合伙) 11818 | 代理人: | 李志强 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 video transformer 疲劳 驾驶 检测 方法 | ||
1.一种基于Video Transformer的疲劳驾驶检测方法,其特征在于,包括以下步骤:
S1、从正常光照数据集中获取待测视频帧;
S2、通过MTCNN神经网络进行人脸图像提取;
S3、将提取出的人脸图像序列输入到Video Transformer中获取最终疲劳检测判定结果;
所述步骤S2中通过MTCNN神经网络进行人脸图像提取具体包括以下步骤:
(1)从正常光照视频集中,拆分出视频帧;
(2)将视频帧进行处理,得到复杂光照环境下的视频帧,模拟仿真驾驶员夜间行驶的视频帧;
(3)针对待测视频帧使用MTCNN神经网络进行人脸提取操作,得到人脸候选窗口和5个人脸关键点位置信息;
所述步骤S3中将提取出的人脸图像序列输入到Video Transformer中获取最终疲劳检测判定结果具体包括以下步骤:提供给Video Transformer模型图像的原始输入维度大小为[3,6,299,299]的特征向量,使用这个尺寸来使输入与用于混合模型Video Transformer中图像特征提取的主干网络XceptionNet相兼容,通过XceptionNet提取图像特征后,得到一个维度为[2048,10,10]的特征向量,然后将该特征向量传递给一个2D卷积层和一个线性层,得到一个维度为[1,32,768]的特征向量,在得到面部图像和UV纹理图的两个重构特征向量后,将这两个重构特征向量连接起来,得到一个维度为[1,64,768]的特征向量,然后将一维学习片段嵌入添加到维度为[1,64,768]的特征向量中,对所有序列帧执行此操作,并将它们连接维度为[1,576,768]的特征向量,将学习的位置嵌入添加到维度为[1,576,768]的特征向量中,并在维度为[1,576,768]的特征向量的开头添加标记,使用最终的维度为[1,577,768]的特征向量作为所提出的Video Transformer模型的输入,训练VideoTransformer模型5个epoch,学习率为3×10−3,选择SGD作为优化器,并使用CrossEntropyLoss作为损失函数,模型的输出为0或者1,其中0表示清醒,1表示疲劳。
2.根据权利要求1所述的一种基于Video Transformer的疲劳驾驶检测方法,其特征在于,所述步骤S1中从正常光照数据集中获取待测视频帧具备包括以下步骤:
(1)通过原始图像I得到h、w,根据h、w设置两个尺寸为h*w的像素表格、;
(2)在上进行填充像素值,使得,其中;
(3)在上同样进行填充数值,使得,其中,,设定了;
(4)最后将与进行相乘得到一张新的图像,即,其中。
3.根据权利要求1所述的一种基于Video Transformer的疲劳驾驶检测方法,其特征在于:
所述MTCNN神经网络由三个子网结构组成,分别为Proposal Network、Refine Network和Output Network;
用Proposal Network卷积神经网络,获得候选窗体和边界回归向量,同时,候选窗体根据边界框进行校准,然后利用非极大值抑制去除重叠窗体;
使用Refine Network卷积神经网络进行操作,将经过Proposal Network确定的包含候选窗体的图片在Refine Network中训练,最后使用全连接网络进行分类,利用边界框向量微调候选窗体,最后利用非极大值抑制算法去除重叠窗体;
使用Output Network卷积神经网络进行操作,该网络比Refine Network多一层卷积层,功能与Refine Network类似,在去除重叠候选窗口的同时标定5个人脸关键点位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210366039.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:冷却循环系统
- 下一篇:多功能本安型矿用电源
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法