[发明专利]一种利用重映射注意力识别分心驾驶的方法在审
申请号: | 202111564286.2 | 申请日: | 2021-12-20 |
公开(公告)号: | CN114241454A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 路小波;陆明琦;胡耀聪 | 申请(专利权)人: | 东南大学 |
主分类号: | G06V20/59 | 分类号: | G06V20/59;G06V40/20;G06V10/80;G06V10/82;G06V10/764;G06V10/774;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 周蔚然 |
地址: | 211100 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 映射 注意力 识别 分心 驾驶 方法 | ||
本发明公开了一种利用重映射注意力识别分心驾驶的方法,设计了多尺度注意力编码器以提取驾驶员图像的全局特征。由于姿势估计中的热图提供了身体部位的表达性非参数编码,通过对驾驶员部位热图和全局特征图进行哈达玛乘积,将部位信息投影到全局特征上,从而增强了驾驶员行为描述符的辨别力,为了提高鲁棒性和泛化能力,提出了部位注意力丢弃操作,即在训练过程中随机丢失某部位热图,以应对其不可见的情况。本发明引导模型着重于与驾驶员行为相关的部位,可进一步提高驾驶员行为识别准确率。本发明在交通安全领域有重要的应用价值。
技术领域
本发明属于图像处理和模式识别领域,具体涉及一种利用重映射注意力识别分心驾驶的方法。
背景技术
根据世界卫生组织(WHO)的报告,全世界每年有135万人死于交通事故。每天有将近3700人死于世界道路上。“本报告中最令人心碎的统计数据之一是,道路交通伤害是5至29岁年龄段人群死亡的主要原因”。该报告还显示,死亡人数逐年增加,这些事故背后的最常见原因是驾驶员分心。在年轻驾驶者和新手驾驶者中,驾车时使用手机十分普遍,这进一步增加了这些人群中本已很高的撞车和死亡风险。开车时使用电话会使撞车的可能性增加四倍,而发短信则使撞车的危险增加23倍。同样,使用电话的驾驶员的反应时间也比不使用电话的速度慢了50%。因此驾驶员行为识别算法的研究对道路安全管理和交通智能化有重要的意义。
发明内容
为解决上述问题,本发明公开了一种利用重映射注意力识别分心驾驶的方法,挖掘并跟踪具有辨别性的部位特征,以区分外观相似的驾驶行为,并在测试阶段实现了实时驾驶员行为识别,能够进一步提高驾驶员行为识别准确率,在交通安全领域有重要的应用价值。
为达到上述目的,本发明的技术方案如下:
一种利用重映射注意力识别分心驾驶的方法,包括以下步骤:
步骤1:使用公开的StateFarm分心驾驶数据集作为实验数据集;
步骤2:对StateFarm数据集进行数据增强处理,包括:随机裁剪,随机旋转一定角度,水平翻转,仿射变换,RGB颜色扰动;
步骤3:构建重映射注意力网络,其由多尺度注意力编码器,部位重映射和部位注意力丢失组成;该模型首先生成全局特征图和头部,手和肘部五个部位热图;然后,逐元素将全局特征和部位引导特征相加,并将总和输入全局平均池化层中,以生成部位增强的全局表示;最后,级联五个分支的输出以分类;其中,在模型训练时使用部位注意力丢失以增强鲁棒性;
步骤301:提出多尺度注意力编码器以提取全局特征,这些特征被所有后续分支所共享,多尺度注意力编码器中基于膨胀空间金字塔池,以充分利用不同尺度的全局上下文;本发明在膨胀空间金字塔池中加入了一个非局部块作为注意力模块;具体而言,x表示输入,输出其中i和j是特征位置索引;将两两函数f(xi,xj)设置为点积运算,以计算注意力系数;为了简化,将g设为g(xj)=xj,将归一化函数C设为C(x)=n,其中n为x的有效像素数,因此
然后将注意力图进行1×1卷积,并加入到x中,得到非局部模块的最终输出z,即zi=Wzyi+xi,其中Wz是卷积权值;
步骤302:使用OpenPose来预测驾驶员部位热图,这些富含空间信息的部位热图可被视为全局特征的注意力图;对于每个部位,将热图与全局特征图进行点乘以生成局部细化的特征;将驾驶员部位信息投影到全局特征,可使特征表示更具区分性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111564286.2/2.html,转载请声明来源钻瓜专利网。