[发明专利]一种语义导向的半监督视频对象分割方法在审

专利信息
申请号: 201710487525.6 申请日: 2017-06-23
公开(公告)号: CN107301400A 公开(公告)日: 2017-10-27
发明(设计)人: 夏春秋 申请(专利权)人: 深圳市唯特视科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06T7/10;G06T7/194
代理公司: 暂无信息 代理人: 暂无信息
地址: 518057 广东省深圳市高新技术产业园*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语义 导向 监督 视频 对象 分割 方法
【权利要求书】:

1.一种语义导向的半监督视频对象分割方法,其特征在于,主要包括卷积神经网络提取特征(一);语义选择和语义传播(二);通过条件分类器将外观模型与语义先验相结合(三);训练网络(四)。

2.基于权利要求书1所述的卷积神经网络提取特征(一),其特征在于,使用VGG16卷积神经网络作为骨干网;去除完全连接层和最后的池层,增加空间特征分辨率;添加跳过连接,提取超柱状体的特征,聚合来自不同层的多尺度信息;在第二、第三、第四和第五卷积层块相应的合并层之前,从它们之中提取输出特征图;然后调整特征图,使其与输入图像大小相同,并且将它们连接形成超柱状体的特性。

3.基于权利要求书1所述的语义选择和语义传播(二),其特征在于,利用语义实例分割算法作为输入,估计待分割对象的语义;选择多任务网络级联(MNC)作为输入实例分割算法;MNC是一个多阶段网络,由三个主要部分组成:共享卷积层、区域提议网络(RPN)和感兴趣区域(ROI)-智能分类器。

4.基于权利要求书3所述的语义选择,其特征在于,语义选择发生在视频第一帧中,根据标定的真实数据掩码选择匹配对象的掩码(处于半监督框架中,其中第一帧的真实掩码为输入);选择感兴趣区域,进行分类,将标定的真实数据与实例分段提议重叠。

5.基于权利要求书3所述的语义传播,其特征在于,语义传播阶段发生在第一帧以后,将第一帧中估计的语义传播到之后的帧;使用第一轮前景估计对实例分割掩码进行过滤,并且选择池顶部匹配对象。

6.基于权利要求书1所述的通过条件分类器将外观模型与语义先验相结合(三),其特征在于,使用完全卷积网络的密集标签,通常表达为每个像素的分类问题;因此,可以理解为在整个图像上滑动的全局分类器,并且根据外观模型将前景或背景标签分配给每个像素;如果将最终分类之前的语义合并,可以作为当前框架中最有可能的实例(或一组实例)的掩码。

7.基于权利要求书6所述的像素,其特征在于,对于每个像素i,估计给定图像的前景像素的概率:p(i|I);概率可以分解为由先前加权的k个条件概率的和:

p(i|I)=Σk=1Kp(i|I,k)p(k|I)---(1)]]>

其中,K=2。

8.基于权利要求书6所述的条件分类器,其特征在于,构建两个条件分类器,一个注重前景像素,另一个侧重于背景像素;基于实例分割输出估计先验项p(k|I);具体来说,如果像素位于实例分割掩码内,则像素依赖于前景分类器;并且如果背景分类掩码脱离实例分割掩码,则背景分类器更重要;在实验中,应用高斯滤波器将所选掩模的空间平滑作为语义先验。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710487525.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top