[发明专利]一种基于注意力机制的车辆跟踪的实现方法和装置在审
申请号: | 202310612880.7 | 申请日: | 2023-05-26 |
公开(公告)号: | CN116524411A | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 杜忠田;陈澍;郭彩丽;杨洋;刘芳芳 | 申请(专利权)人: | 中电信数智科技有限公司;北京邮电大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/82;G06V10/774;G06V10/764;G06V10/74 |
代理公司: | 北京知汇林知识产权代理事务所(普通合伙) 11794 | 代理人: | 王俊杰 |
地址: | 100036 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 车辆 跟踪 实现 方法 装置 | ||
1.一种基于注意力机制的车辆跟踪的实现方法,其特征在于,该方法包括:
步骤S1,采用根据颜色、纹理、尺寸和空间交叠相似度的选择性搜索对图像进行处理,生成候选区域;
步骤S2,采用无锚点的目标检测骨干网络,自适应目标特征,利用关键特征点与被检测物体进行匹配;
步骤S3,构建基于注意力机制的车辆跟踪算法,并设定和调整车辆跟踪算法参数集,将步骤S2保存的关键特征点数据导入所述基于注意力机制的车辆跟踪算法中,迭代生成车辆跟踪信息模型并保存。
2.根据权利要求1所述的方法,其特征在于,在步骤S1之前,该方法还包括:步骤S0,获取包含视频文本成对标注信息的训练数据集合T、验证数据集合V及测试数据集合U。
3.根据权利要求1所述的方法,其特征在于,步骤S2进一步包括:
步骤S200,在卷积层得到的特征图是256层,每层都做一次空间金字塔池化;先把每个特征图分割成多个不同尺寸的网格,然后每个网格最大空间金字塔池化,将256层特征图形成16256,4256,1256维特征,并连接形成固定长度的特征向量,将所述固定长度的特征向量输入到后面的全连接层;
步骤S201,控制卷积层输出的特征图的大小,以控制网络结构完成特征提取;
步骤S202,给定含N个样本的训练集X={(x1,y1),…,(xN,yN)},其中K维特征向量xn∈RK,类标签yn∈{1,2,...,M},n=1,…,N;训练集数据共M个类,任务是找到决策函数y=f(x)用于预测新数据的类别;
步骤S203,通过学习映射关系,对目标候选的位置进行精化实现边界框回归。
4.根据权利要求1所述的方法,其特征在于,步骤S3进一步包括:
步骤S300,引入空间注意力机制中给定一个H×W×C的特征F,先分别进行一个通道维度的最大池化和平均池化得到两个H×W×1的通道描述,并将这两个描述按照通道拼接在一起;然后,经过一个7×7的卷积层,用Sigmoid函数激活,得到权重系数Ms;最后Ms和输入的特征F相乘即可得到缩放后的新特征;
步骤S301,给定一个任务相关的查询向量Q,以当前帧的特征图为K,通过计算与K的注意力分布并附加在变换值V上,从而计算注意值得分;
步骤S302,注意力机制通过对编码器所有时间步的隐藏状态做加权求和来得到背景信息,编码器把所有时间步的隐藏层状态传递给解码器;
步骤S303,在多尺度可变注意力编码器部分,Q为全图像素点,每个Q找4个K值作为参考点,从多尺度聚合不同层的特征;
步骤S304,解码器查看所有接收到的编码器的隐藏层状态。
5.根据权利要求4所述的方法,其特征在于,在步骤S304中,编码器中每个隐藏层状态都对应到输入图像中的一个区域,一个隐藏层状态对应一个时间步,时间步对应一个区域,将每个隐藏层状态乘以经过softmax归一化的对应分数,从而使得分数高所对应的隐藏层状态会被放大,而分数低所对应的隐藏层状态会被缩小。
6.根据权利要求1所述的方法,其特征在于,在步骤S3中还包括,读取步骤S0中整理的验证数据集合对基于注意力机制的车辆跟踪算法的结果进行准确率判定,若无性能增益,则返回执行S2,否则训练结束。
7.根据权利要求1所述的方法,其特征在于,步骤S3后,还包括如下步骤:
步骤S4,依次逐条读取步骤S0整理的测试数据集合,加载步骤S3保存的基于注意力机制的车辆跟踪模型文件,将检测框分成高分数和低分数的两个集合,使用交并比距离依次对轨迹和高、低分数检测框进行相似度计算,进行跟踪准确率测试,统计出最终跟踪准确率结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电信数智科技有限公司;北京邮电大学,未经中电信数智科技有限公司;北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310612880.7/1.html,转载请声明来源钻瓜专利网。