[发明专利]基于多源显著性和时空榜样适配的弱监督视频目标分割方法在审
| 申请号: | 202110322786.9 | 申请日: | 2021-03-25 |
| 公开(公告)号: | CN113283438A | 公开(公告)日: | 2021-08-20 |
| 发明(设计)人: | 段立娟;恩擎;王文健;乔元华 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06K9/38 | 分类号: | G06K9/38;G06K9/46;G06K9/62;G06T7/11;G06T7/194;G06N3/04;G06N3/08 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 显著 时空 榜样 监督 视频 目标 分割 方法 | ||
1.基于多源显著性和时空榜样适配的弱监督视频目标分割方法,其特征包括构造时空显著掩码训练目标、构造时空榜样训练目标,以及训练与测试弱监督目标分割网络:
步骤1:构造数据集
构造训练弱监督视频目标分割图像集,包括视频帧和对应的弱标签;其中,构造的训练集表示为It表示视频帧RGB图像,Yt表示It对应的类别标注;
构造时空显著掩码训练目标阶段包括:
步骤2:提取空间显著性掩码
输入视频帧It,使用空间显著检测器作用于视频帧It提取空间显著性掩码表示视频中空间最显著区域,计算公式如下:
其中σ表示sigmoid函数,up表示双线性采样操作,It表示输入尺寸为c*h*w的视频帧,c=3表示输入的为RGB图像,的尺寸为1*h*w;
步骤3:提取时间显著性掩码
输入视频帧It和It+1提取视频相邻帧对应的光流,使用最小栅栏距离(MBD)作用于光流提取时间显著性掩码表示视频中运动最明显区域;
步骤4:融合时间和空间显著性掩码,得到时空显著性掩码
以视频帧It为输入,以步骤2得到的空间显著性掩码和步骤3得到的时间显著性掩码为训练目标,训练时空显著融合网络随后使用训练好的对输入It前行推理得到时空显著性掩码能够很大程度上过滤掉了运动的背景信息。
构造时空榜样训练目标阶段包括:
步骤5:计算视频帧的时空契合度,选择部分视频帧作为时空榜样信息
计算步骤2得到的空间显著性掩码和步骤3得到的时间显著性掩码的契合度,并将其进行排序,选择同一个类别视频中前N个时空契合度高的视频帧作为时空榜样信息;
训练与测试弱监督目标分割网络阶段包括:
步骤6:计算损失,更新弱监督视频目标分割网络参数
使用步骤4得到的时空显著性掩码、步骤5得到的时空榜样信息作为弱监督视频监督信息,计算分割损失和时空榜样适配损失训练弱监督目标分割网络。当分割损失和时空榜样适配损失同时达到最小时,弱监督目标分割网络训练完成;
步骤7:输出弱监督视频目标分割结果
针对输入视频帧,将其输入步骤6训练的弱监督视频目标分割网络进行前向推理,得到最终目标分割结果。
2.根据权利要求1所述的基于多源显著性和时空榜样适配的弱监督视频目标分割方法,其特征在于,步骤3具体包括以下步骤:
首先将视频帧It和It+1输入到现有光流提取网络FlowNet2生成光流图:
其中表示FlowNet2,随后最小栅栏距离MBD方法作用于光流图Ot→t+1,通过迭代最小化在光流图Ot→t+1上的最小块路径损失,得到视频在t时刻对应的时间显著性掩码具体公式如下:
在此过程中,通过光栅扫描的方法遍历光流图Ot→t+1中的每个像素位置,通过使用每个位置x附近的一半的像素y来迭代最小化在位置x处的距离,从而生成距离图
其中P(y)表示到达y的路径,而y,x表示从y到达x的边,表示路径损失函数:
其中Py(x)表示P(y)·y,x),和表示P(y)的最大和最小值。
3.根据权利要求1所述的基于多源显著性和时空榜样适配的弱监督视频目标分割方法,其特征在于,步骤4具体包括以下步骤:当前视频帧It为输入,步骤2得到的空间显著性掩码和步骤3得到的时间显著性掩码为训练目标,计算多源融合损失来训练时空显著融合网络其中多源融合损失为:
其中表示多源融合显著区域,随后,通过前行推理得到时空显著性掩码能够很大程度上过滤掉了运动的背景信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110322786.9/1.html,转载请声明来源钻瓜专利网。





