[发明专利]一种语义导向的半监督视频对象分割方法在审

申请号：	201710487525.6	申请日：	2017-06-23
公开（公告）号：	CN107301400A	公开（公告）日：	2017-10-27
发明（设计）人：	夏春秋	申请（专利权）人：	深圳市唯特视科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06T7/10;G06T7/194
代理公司：	暂无信息	代理人：	暂无信息
地址：	518057 广东省深圳市高新技术产业园***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语义导向监督视频对象分割方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语义导向的半监督视频对象分割方法，其特征在于，主要包括卷积神经网络提取特征(一)；语义选择和语义传播(二)；通过条件分类器将外观模型与语义先验相结合(三)；训练网络(四)。

2.基于权利要求书1所述的卷积神经网络提取特征(一)，其特征在于，使用VGG16卷积神经网络作为骨干网；去除完全连接层和最后的池层，增加空间特征分辨率；添加跳过连接，提取超柱状体的特征，聚合来自不同层的多尺度信息；在第二、第三、第四和第五卷积层块相应的合并层之前，从它们之中提取输出特征图；然后调整特征图，使其与输入图像大小相同，并且将它们连接形成超柱状体的特性。

3.基于权利要求书1所述的语义选择和语义传播(二)，其特征在于，利用语义实例分割算法作为输入，估计待分割对象的语义；选择多任务网络级联(MNC)作为输入实例分割算法；MNC是一个多阶段网络，由三个主要部分组成：共享卷积层、区域提议网络(RPN)和感兴趣区域(ROI)-智能分类器。

4.基于权利要求书3所述的语义选择，其特征在于，语义选择发生在视频第一帧中，根据标定的真实数据掩码选择匹配对象的掩码(处于半监督框架中，其中第一帧的真实掩码为输入)；选择感兴趣区域，进行分类，将标定的真实数据与实例分段提议重叠。

5.基于权利要求书3所述的语义传播，其特征在于，语义传播阶段发生在第一帧以后，将第一帧中估计的语义传播到之后的帧；使用第一轮前景估计对实例分割掩码进行过滤，并且选择池顶部匹配对象。

6.基于权利要求书1所述的通过条件分类器将外观模型与语义先验相结合(三)，其特征在于，使用完全卷积网络的密集标签，通常表达为每个像素的分类问题；因此，可以理解为在整个图像上滑动的全局分类器，并且根据外观模型将前景或背景标签分配给每个像素；如果将最终分类之前的语义合并，可以作为当前框架中最有可能的实例(或一组实例)的掩码。

7.基于权利要求书6所述的像素，其特征在于，对于每个像素i，估计给定图像的前景像素的概率：p(i|I)；概率可以分解为由先前加权的k个条件概率的和：

p(i|I)=Σk=1Kp(i|I,k)p(k|I)---(1)]]>

其中，K＝2。

8.基于权利要求书6所述的条件分类器，其特征在于，构建两个条件分类器，一个注重前景像素，另一个侧重于背景像素；基于实例分割输出估计先验项p(k|I)；具体来说，如果像素位于实例分割掩码内，则像素依赖于前景分类器；并且如果背景分类掩码脱离实例分割掩码，则背景分类器更重要；在实验中，应用高斯滤波器将所选掩模的空间平滑作为语义先验。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司，未经深圳市唯特视科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710487525.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于俯视图像的水面桥梁识别方法
下一篇：一种多目标猕猴桃果实识别方法与图像获取装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语义导向的半监督视频对象分割方法在审

专利文献下载