[发明专利]一种基于多精度交互的人群轨迹预测方法有效
申请号: | 202110855170.8 | 申请日: | 2021-07-26 |
公开(公告)号: | CN113362367B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 刘绍华;孙靖凯 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06T7/207 | 分类号: | G06T7/207;G06T7/246;G06N3/04 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 周长琪 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 精度 交互 人群 轨迹 预测 方法 | ||
1.一种基于多精度交互的人群轨迹预测方法,其特征在于,包括如下步骤:
步骤1,获取行人历史轨迹视频,为行人建立个体运动的时空连续性模型;其中使用LSTM网络来编码行人的历史状态,使用行人的相对位置作为LSTM网络的输入;
步骤2,对行人运动交互建模,包括全局交互建模和局部交互建模;
步骤2.1,全局交互建模包括:(1)首先按照设置的精度对当前场景进行区域划分,将每个行人的位置坐标映射为场景的区域坐标,并构建一个遮掩矩阵用来判断划分的区域内是否有行人存在;(2)在划分的每个子区域内构建图网络,每个行人对应一个节点,用边记录行人之间是否存在交互信息;对每个子区域内个体先采用图卷积网络进行建模交互,再利用最大池化操作聚合区域信息;
其中,设t时刻区域r内存在Nr个行人,该区域的图网络表示为为节点集合,每个节点代表一个行人的状态信息,代表行人Nr的运动状态;是一个0-1矩阵,元素值为1代表两行人之间存在交互信息,值为0代表两行人之间不存在交互信息;将输入图卷积网络后得到建模交互后的行人状态信息再对最大池化操作得到输出结果
其中,Wgcn是图卷积网络的参数,Q是Wgcn的参数维度;
(3)基于行人i在t时刻的运动状态和交互信息利用自注意力机制融合不同子区域交互信息,获取行人的全局交互信息;
步骤2.2,局部交互建模,包括:(1)根据邻居阈值筛选出产生交互的周围行人;(2)基于行人运动状态,利用注意力机制对周围行人的交互进行融合得到行人的局部交互信息;
步骤2.3,将行人i的局部交互信息和全局交互信息拼接,得到行人i在t时刻的完整交互信息;
步骤3,利用注意力机制对行人不同时刻的完整交互信息分配不同的权重,获取对行人观察时刻融合后的交互信息Hinteraction,将行人的运动信息和交互信息Hinteraction拼接作为解码端的LSTM的初始化向量,利用解码端LSTM预测行人的相对位置,进而预测行人的绝对位置。
2.根据权利要求1所述的方法,其特征在于,所述的步骤1中,设代表行人i在t时刻相对于上一时刻的相对位置,i为行人的编号,使用标记为E-LSTM的LSTM模型编码行人的历史状态时,先利用多层感知机fe将相对位置映射到一个固定的高维空间,得到然后输入E-LSTM模型中,如下:
其中,We为多层感知机fe的训练参数,WE-LSTM为E-LSTM模型参数,为E-LSTM模型输出的行人i在t时刻的运动状态。
3.根据权利要求1所述的方法,其特征在于,所述的步骤2.1中,设场景划分的精度R=m×n,每个行人坐标(Pi(x),Pi(y))映射为场景的区域坐标(PRi(x),PRi(y)),i=1,2,…N,N为当前场景中的行人数量,如下:
遮掩矩阵M的大小为m×n,设置矩阵元素M[PRi(x)][PRi(y)]=1;
其中,(xmin,xmax,ymin,ymax)为场景的坐标范围,m、n均为正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110855170.8/1.html,转载请声明来源钻瓜专利网。