[发明专利]一种基于运动轮廓语义图预测行车危险场景的方法有效
申请号: | 202010026768.1 | 申请日: | 2020-01-10 |
公开(公告)号: | CN111242015B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 高珍;欧明锋;余荣杰;许靖宁;冯巾松 | 申请(专利权)人: | 同济大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V20/58;G06V10/25;G06V10/44;G06V10/774;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 宣慧兰 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 运动 轮廓 语义 预测 行车 危险 场景 方法 | ||
1.一种基于运动轮廓语义图预测行车危险场景的方法,其特征在于,包括以下步骤:
步骤S1:获取车辆的驾驶视频,分割所述驾驶视频的感兴趣区域;
步骤S2:将所述驾驶视频的感兴趣区域使用目标检测算法来检测交通对象并生成包含语义的运动轮廓语义图;
步骤S3:统计车辆的运动数据,根据统计结果设置加速度阈值将所述运动轮廓语义图划分为高风险事件或正常事件;
步骤S4:将所述高风险事件或正常事件输入到随机森林分类器,根据特征重要性对分类结果进行排序,获得重要运动学特征;
步骤S5:根据所述运动轮廓语义图和重要运动学特征,构建多模态深度神经网络模型;
步骤S6:对待检测驾驶视频执行步骤S1-S4,获得所述待检测驾驶视频的运动轮廓语义图和重要运动学特征并输入至所述多模态深度神经网络模型,预测行车是否具有风险,若有风险则向驾驶员报警;
所述步骤S2中生成运动轮廓语义图具体过程如下:
步骤S201:对所述驾驶视频的每一帧图像的感兴趣区域进行均值化处理,转化为一行像素;
步骤S202:将所有的所述一行像素按时间顺序拼接在一起形成运动轮廓图;
步骤S203:通过实时对象检测框架对所述运动轮廓图进行识别,判断识别出的交通环境中的交通对象是否位于感兴趣区域内,若是则按照所述交通对象在驾车视频对于的帧画面中的横向位置,将所述交通对象以有色像素线段的形式标在所述运动轮廓图中相应帧线的位置上,形成运动轮廓语义图;
所述特征重要性通过所述高风险事件或正常事件相应特征的基尼指数决定;
步骤S4的具体过程如下:
步骤S401:将一个包含ml条记录,每条记录有多个运动学特征的事件,提取出n个运动学特征{m1,…,mn}作为该样本的重要特征,以事件分类作为该样本的分类标签值,生成样本集合;
步骤S402:通过抽样放回的方法从样本集合中选取ns个样本作为训练集,重复q次生成q个训练集{S1,…,Sq};
步骤S403:以每个训练集作为一棵决策树的输入,构建包含q棵CART决策树的随机森林{T1,…,Tq},其中对于Ti上的每一个节点随机不重复的选择mnode个特征,利用这mnode个特征对Si进行划分,并使用使基尼指数最小化作为标准获得最佳划分,从而训练出q棵CART决策树;
步骤S404:根据特征重要性对分类结果进行排序,获得重要运动学特征,具体为:
步骤S4041:计算出{m1,…,mn}中每个运动学特征mj在所有决策树中节点分裂不纯度的平均改变量Ij,即重要性,节点o的不纯度使用基尼指数来衡量,具体如下:
其中,GIo为节点o的不纯度,k表示类别:高风险、正常,pok表示节点o中类别k所占的比例,pok′表示非类别k所占的比例;
步骤S4042:计算mj在第i棵树的重要性Iji,公式如下:
Iji=∑o∈OIjio=∑o∈O(GIjio-Gjiol-Gjior)
其中,O为第i棵树的包含运动学特征mj的节点集合,GIjio为第i棵树的节点o的基尼指数,Gjiol,Gjior为节点o分支后的左右两个新节点的基尼指数;
步骤S4043:计算mj在所有树中的重要性Ij,公式如下:
其中,q为CART决策树的数量;
步骤S4044:获得所有运动学特征的重要性集合{I1,…,IX}后,将重要性做归一化处理,具体如下:
将完成归一化处理的特征的重要性集合从大到小排序,获得重要性排名前nimportant的特征
步骤S405:将正常事件预备集和高风险事件预备集合的每个事件使用该事件中的上述nimportant个运动学特征来代表,即每个事件的为其中id为事件编号,label为事件类型,形成正常事件集和高风险事件集
多模态深度神经网络模型具体包括:
输入层,将运动轮廓语义图转化为矩阵m1;
Conv1层,设定卷积层参数,包括过滤器个数、大小及步长和激活函数,输入m1得到矩阵m2;
Pool1层,设定池化层参数,包括过滤器大小及类型和步长等,输入m2进行最大池化得到矩阵m3;
Conv2层,设定卷积层参数,输入m3经过ReLU激活函数得到矩阵m4;
Pool2层,设定池化层参数,输入m4进行最大池化得到矩阵m5;
Conv3层,设定卷积层参数,输入m5经过ReLU激活函数得到矩阵m6;
Conv4层,设定卷积层参数,输入m6经过ReLU激活函数得到矩阵m7;
Conv5层,设定卷积层参数,输入m7经过ReLU激活函数得到矩阵m8;
Pool5层,设定池化层参数,输入m8进行最大池化得到矩阵m9;
FC6平滑层,将输入的矩阵m9平滑为一维矩阵m10;
Drop6层,输入矩阵m10,以一定比例的Dropout概率丢弃部分神经节点,防止过拟合,并得到矩阵m11;
FC7全连接层,输入矩阵m11,输出r×1的一维矩阵m12;
将m12与fkinematic合并,即[fkinematicm12]作为FC8全连接层的输入,输出为2×1的矩阵,该矩阵中的两个值对应着属于有风险类别和属于无风险类别的概率的预测值,接着使用Softmax处理预测值使两类的概率和为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010026768.1/1.html,转载请声明来源钻瓜专利网。