[发明专利]一种基于多层特征融合的卷积神经网络打哈欠行为识别方法及装置在审
申请号: | 201910511594.5 | 申请日: | 2019-06-13 |
公开(公告)号: | CN110321807A | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 姜磊;周金明;李军 | 申请(专利权)人: | 南京行者易智能交通科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210014 江苏省南京市秦淮区永智*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多层特征融合的卷积神经网络打哈欠行为识别方法,包含如下步骤:步骤1,采集驾驶员在驾驶状态下的面部视频帧图像作为样本;步骤2,采用人脸检测算法对所述面部视频帧图像进行人脸区域定位,提取出人脸图像,步骤3,对样本进行分类,步骤4,训练基于ShuffleNetV2网络修改的多层特征融合的卷积神经网络,直到在测试集上精度达到最优;步骤5,打哈欠张嘴识别检测。本发明通过基于ShuffleNeV2网络结构设计的多层特征融合的卷积神经网络来端到端的打哈欠张嘴识别,解决了打哈欠识别算法逻辑复杂且精度不高的问题。 | ||
搜索关键词: | 卷积神经网络 特征融合 多层 视频帧图像 行为识别 样本 人脸检测算法 网络结构设计 驾驶状态 人脸区域 人脸图像 算法逻辑 网络修改 测试集 采集 分类 检测 | ||
【主权项】:
1.一种基于多层特征融合的卷积神经网络打哈欠行为识别方法,其特征在于,包含如下步骤:步骤1,采集驾驶员在驾驶状态下的面部视频帧图像作为样本;步骤2,采用人脸检测算法对所述面部视频帧图像进行人脸区域定位,根据人脸检测算法给出的人脸坐标(X,Y,W,H),提取出人脸图像,其中(X,Y)表示人脸图像左上角的点,W,H分别对应人脸图像的宽和高;步骤3,挑选出非打哈欠状态下驾驶员的人脸图像,归集为类别0,挑选出打哈欠状态下驾驶员的面部图像,归集为类别1,所述非打哈欠状态包括面无表情、讲话、微笑等;步骤4,训练基于ShuffleNetV2网络修改的多层特征融合的卷积神经网络,直到在测试集上精度达到最优;步骤5,将驾驶员在驾驶状态下的实时面部视频帧图像经过步骤2处理后获取人脸区域,每隔1‑4s输入训练好的卷积神经网络,输出单张图像是否张嘴识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京行者易智能交通科技有限公司,未经南京行者易智能交通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910511594.5/,转载请声明来源钻瓜专利网。