[发明专利]一种基于自监督学习的视频目标分割方法有效
申请号: | 202110216793.0 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112967309B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 洪德祥;李国荣;苏荔;黄庆明 | 申请(专利权)人: | 中国科学院大学 |
主分类号: | G06T7/215 | 分类号: | G06T7/215;G06N3/04;G06N3/08 |
代理公司: | 北京康思博达知识产权代理事务所(普通合伙) 11426 | 代理人: | 潘炜;刘冬梅 |
地址: | 100049 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 学习 视频 目标 分割 方法 | ||
1.一种基于自监督学习的视频目标分割方法,其特征在于,所述方法包括以下步骤:
步骤1,建立视频目标分割网络;
所述建立的视频目标分割网络包括记忆检索子网络和协作优化子网络,
其中,所述记忆检索子网络用于学习视频帧的特征嵌入,执行逐像素对应关系并将目标掩膜传播到后续帧;
所述协作优化子网络用于汇总参考帧和查询帧的信息,并学习参考帧与查询帧之间的协作关系,以优化传播的目标掩膜;
步骤2,对视频目标分割网络进行训练;
步骤2包括训练记忆检索子网络和训练协作优化子网络;
所述记忆检索子网络的训练包括以下步骤:
步骤2-1,对视频帧进行预处理;
步骤2-2,获得查询帧与参考帧的相似度矩阵;
步骤2-3,重建参考帧;
所述协作优化子网络的训练按照包括以下步骤的方法进行:
步骤I,在视频帧序列中采样两个帧,在第一帧上初始化目标掩膜;
步骤II,在上述两个帧上执行向前和向后跟踪,将最后预测的目标掩膜与初始化的目标掩膜之间的误差作为监督信号。
2.根据权利要求1所述的基于自监督学习的视频目标分割方法,其特征在于,
步骤2-1中,所述预处理包括将视频RGB帧转换为LAB颜色空间的步骤。
3.根据权利要求1所述的基于自监督学习的视频目标分割方法,其特征在于,所述目标掩膜的初始化包括以下步骤:
步骤i,在单个视频帧中寻找显著区域,产生视觉显著性;
步骤ii,获取连续视频帧的时间显著区域,产生运动显著性。
4.一种基于自监督学习的视频目标分割系统,用于实施权利要求1所述的方法。
5.一种计算机可读存储介质,其特征在于,存储有基于自监督学习的视频目标分割程序,所述程序被处理器执行时,使得处理器执行权利要求1至3之一所述基于自监督学习的视频目标分割方法的步骤。
6.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有基于自监督学习的视频目标分割程序,所述程序被处理器执行时,使得处理器执行权利要求1至3之一所述基于自监督学习的视频目标分割方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院大学,未经中国科学院大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110216793.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种折叠无人机
- 下一篇:一种用于干线协调的智能决策方法及系统