[发明专利]基于混合图模型的图像序列类别标注方法有效
| 申请号: | 201510268996.9 | 申请日: | 2015-05-22 |
| 公开(公告)号: | CN104881681B | 公开(公告)日: | 2018-08-14 |
| 发明(设计)人: | 黄文琦;龚小谨;刘济林 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
| 地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 混合 模型 图像 序列 类别 标注 方法 | ||
1.一种基于混合图模型的图像序列类别标注方法,其特征在于,包括如下步骤:
(1)输入图像序列,使用SLIC算法对图像序列中每一帧图像进行超像素分割,获得超像素p,将得到的第t帧图像的第i个超像素记为pit;
(2)使用Kernel描述符对步骤(1)中获得的超像素进行特征描述,得到超像素的特征向量,将超像素pit的特征向量记为fit;
(3)采用KNN算法对步骤(1)中连续两帧图像的超像素进行时间域的匹配;
(4)构建基于混合图模型的全局优化问题,该混合图模型由顶点、两种简单边和一种超边组成;该混合图模型的顶点的集合记为每一个顶点v表示一个超像素的类别标签;该混合图模型的第一种简单边代表顶点的先验信息,该先验信息用势能函数EE(fc)描述;该混合图模型的第二种简单边代表单帧图像空间域上邻接的顶点之间对称的、成对的关系,这种关系用势能函数ES(fc)描述;该混合图模型的超边代表连续帧图像时间域上匹配的顶点之间不对称的、高阶的关系,这种关系用势能函数EH(fc)描述;
所述势能函数EE(fc)的定义为:
其中,表示的是存在类别种子点的超像素v,种子点通过人工标注部分像素点类别标签的方法获得;fc是一个维的列向量,由fc(v),组成,其中fc(v)为分类函数,其值表示顶点v属于类别c的置信度,取值范围在[0,1]之间;表示超像素v属于类别c的置信度的观测值,该观测值通过卷积递归神经网络分类器获得,c∈{1,2,...,C},C表示类别总数;
所述势能函数ES(fc)的定义为:
其中,eS(u,v)为一条第二种简单边,即单帧图像内相邻两个超像素u,v之间的关系,定义为:
eS(u,v)=ws(u,v)·||fc(u)-fc(v)||2, (3)
其中fc(u)∈[0,1]为超像素u属于类别c的置信度,该置信度通过递归卷积神经网络学习获得,ws(u,v)为超像素u,v之间简单边的权重:
σs是根据实验经验设置的常数;
所述势能函数EH(fc)的定义为:
其中,εH表示混合图模型中超边的集合,eH(e)为一条超边e∈εH描述的帧间时域上匹配的多个超像素之间的关系,定义为:
其中,每一条超边e∈εH的权重为wH(e),定义为:
M(v)表示在时序上与超像素v匹配的超像素的集合,H为关联矩阵,该矩阵的大小为H(v,e)的定义为:
H(u,e)的定义为:
d(v)为超图中顶点的度,定义为:
d(u)为超图中顶点u∈V的度,定义为:
δ(e)为超边e∈εH的度,定义为:
该混合图模型的全局优化问题描述如下:
其中,λ1和λ2为调整三项势能函数之间比例关系的权重;
(5)对每一个类别c求解公式(13)中的向量fc,得到顶点属于类别c的置信度,具体包括以下子步骤:
(5.1)将全局优化函数,公式(13)矩阵化为:
其中,S为种子点标识矩阵,它是一个维的对角矩阵,定义如下
该对角矩阵仅在存在目标假设种子点的超像素i对应的位置S(i,i)值为1,其它位置值为0,Ws是一个的稀疏矩阵,其每一行代表一对空间相邻的两个超像素u,v之间的差运算,分别用与作为对应超像素点u,v位置的权重,是超图的拉普拉斯矩阵,I是一个的单位阵,Θ=Dv-1/2HWHDe-1HTDv-1/2,Dv是一个的对角阵,每个对角线上的元素为超图中对应的顶点的度d(v),De是一个|εH|×|εH|的对角阵,每个对角线上的元素为超图中对应的超边的度δ(e),WH是一个|εH|×|εH|的对角阵,每个对角线上的元素为超图中对应的超边的权重wH(e);
(5.2)对全局优化函数公式(14)中的每个类别c的置信度fc,进行线性优化,利用一阶导数等于零得到fc的全局最优解:
(6)将步骤(5)中所有类别c∈{1,2,...,C}求解得到的向量用矩阵F=(f1,f2,...,fC)表示,每个顶点的类别标签由该顶点的类别置信度最大值决定,如下所示:
其中,L为每个顶点类别标签组成的列向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510268996.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





