[发明专利]基于深度学习的端到端全局和局部运动估计方法在审

申请号：	202310029285.0	申请日：	2023-01-09
公开（公告）号：	CN116091555A	公开（公告）日：	2023-05-09
发明（设计）人：	毋立芳;郑祎豪;李尊;相叶	申请（专利权）人：	北京工业大学
主分类号：	G06T7/269	分类号：	G06T7/269;G06V10/77;G06V10/42;G06V10/82;G06N3/0464;G06N3/048;G06N3/08
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	刘萍
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于深度学习端到端全局局部运动估计方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习的端到端全局和局部运动估计方法，其特征在于：

设计了一个用于估计全局和局部运动的端到端深度学习网络，对输入的两个相邻视频帧估计出全局和局部运动；

针对全局运动自身处于低秩空间的特点，设计了一种基于特征降维和升维思想的全局运动估计器，将混合运动中的全局信息进行提取，并排除非全局信息的干扰；

针对混合运动中包含全局和局部运动这一特点，设计了一种基于条件重构思想的训练策略，采用三个损失函数对网络的输出进行约束，使网络无监督地学习两个相邻视频帧中的混合、全局和局部运动信息。

2.根据权利要求1所述的方法，其特征在于步骤(1)中，通过将两个相邻视频帧输入三个深度学习网络结构，即MM模块、GM模块和LM模块，获得全局和局部运动；对于MM模块，通过将视频帧I₁和I₂输入PWC-Net网络的金字塔特征提取器从而获得多尺度特征对，特征金字塔提取器由6层卷积组成，输入输出通道数分别是3-16，16-32，32-64，64-96，96-128，128-196，步长为2，卷积核大小为3×3，从而对输入图片进行6次降采样；除最后一层卷积，每层卷积后都有LeakyReLU激活层；然后计算它们的代价体，从而衡量不同特征之间的相关性，并输入给光流解码器，从而获得混合光流；光流解码器的输入是当前层的代价体、对上一层输出的光流经过二倍上采样后得到的光流、以第一帧I₁输入特征金字塔提取器输出的特征，其中第一帧I₁图像的特征经过1×1卷积将通道数从192变为32，1×1卷积的卷积核大小为1×1，步长为1；光流解码器的卷积层输入输出通道数分别是113-128，128-128，256-96其中256为第1层输出的特征连接第2层输出的特征，得到的新特征的通道数；224-64其中224为第2层输出的特征连接第3层输出的特征，得到的新特征的通道数；160-32其中160为第3层输出的特征连接第4层输出的特征，得到的新特征的通道数；96-2，其中96为第4层输出的特征连接第5层输出的特征，得到的新特征的通道数；步长为2，卷积核为3×3；除最后一层，每层卷积后都有LeakyReLU激活层；MM模块的输出是当前层的光流，进而将其输入给GM模块和LM模块从而获得全局和局部运动。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202310029285.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种多层铝基板及改善多层铝基板弯翘的方法
下一篇：基于信息准则的旋转机械故障特征频带自适应确定方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于深度学习的端到端全局和局部运动估计方法在审

专利文献下载