[发明专利]一种基于判别矩阵变量受限玻尔兹曼机的图像识别方法在审
| 申请号: | 201810336621.5 | 申请日: | 2018-04-16 |
| 公开(公告)号: | CN108510009A | 公开(公告)日: | 2018-09-07 |
| 发明(设计)人: | 尹宝才;田鹏宇;李敬华;孔德慧;王立春 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 受限玻尔兹曼机 分类器 矩阵 图像识别 标签层 判别式矩阵 标签信息 二维图像 分类性能 结构信息 提取特征 训练阶段 原始样本 向量化 建模 链接 微调 图像 分类 融入 保留 | ||
1.一种基于判别式矩阵变量受限玻尔兹曼机模型的图像识别方法,其特征在于,包括以下步骤:
步骤1、判别式矩阵变量受限玻尔兹曼机模型
矩阵变量受限玻尔兹曼机模型的能量函数定义为:
其中,为可视层矩阵变量,表示输入数据,即输入图像,每帧图像尺寸大小为I×J;为隐含层矩阵变量,表示基于该模型提取的输入数据的具有判别性的特征,即表示输入图像的特征,大小为K*L;为X与H的连接权重,是四阶张量变量,表示输入图像与模型提取到的特征之间的非线性映射关系;为可见层的偏置矩阵变量,表示输入数据的偏移量;为隐含层的偏置矩阵变量,表示输出特征的偏移量;
可基于该能量函数定义可见层和隐含层的联合概率分布,即模型所拟合的输入图像与特征的联合概率,如公式(2):
并基于该联合概率分布定义对数似然函数:
进一步,采用基于判别的矩阵变量受限玻尔兹曼机用于二维图像分类,记为DisMVRBM,即在原MVRBM模型基础上增加类别约束,使改进的MVRBM具有分类能力,
DisMVRBM旨在通过隐层特征H建模输入图像数Dtrain={X(1),...,X(n),...,X(N)}和相应类别标签Y=[Yzt]∈RZ*T,Z=1的联合分布,因此定义有类别约束的能量函数如下:
其中,为可见层标签矩阵变量,标识输入数据的类别,即输入图像对应的标签,z=Z=1为常数,所以可视为向量变量;为Y与H的连接权重,是四阶张量变量,表示输入图像的标签与输出特征之间的非线性映射关系;为标签层的偏置矩阵变量,表示标签的偏移量,同理,可视为向量变量;
其中,标签层为一位有效编码向量,即如果输入数据的标签为第t类,则该数据对应的标签层向量的第t个分量为1,其他分量均置零。
假定隐含层单元和可见层、以及隐含层和标签层的连接权重具有特定结构,所述特定结构即对权重张量做分解:
和pztkl=qkzrlt
通过定义矩阵形式:
从而得到变形后的DisMVRBM的能量函数为:
E(X,Y,H;Θ)=-tr(UTHVXT)-tr(XTB)-tr(QTHRYT)-tr(YTD)-tr(HTC) (5)
其中,Θ={U,V,Q,R,B,C,D}表示模型所有参数。
基于以上公式,X,Y,H的联合概率,即输入图像、特征与对应标签的联合概率:
上式中归一化常量Z(Θ)定义为:
隐层某个单元被激活的概率,即某一个特征被激活的概率:
其中σ(a)=1/(1+exp(-a)),以矩阵表示为:
p(H=1|X,Y;Θ)=σ(C+UXVT+QYRT) (9)
公式(8)表示逐一计算隐层H的每一个元素为1的概率,σ计算应用到相应的每一个矩阵元素。
可视层某个单元的激活概率,即某个输入图像像素点的激活概率:
矩阵形式表示为:
p(X=1|H;Θ)=σ(B+UTHV) (11)
同公式(8),公式(10)表示逐一计算可见层X的任意一个元素为1的概率,σ计算应用到相应的每一个矩阵元素。同理,标签层各分量的条件概率如下:
其中,yzt=1表示训练图像数据属于第t类。
矩阵形式表示:
这里,分母里涉及的下标t表示标签属于第t类,分子t*表示所有可能的标签的类别。
给定参数Θ,X,Y的联合概率分布为:
步骤2、判别式矩阵变量受限玻尔兹曼机模型求解
假设给定一组包含N个样本的训练图像数据集Dtrain={X(1),...,X(n),...,X(N)},在以如下条件概率为目标函数,基于极大似然法进行参数Θ的估计,似然函数为
其中,N为样本个数;n表示第n个样本;y(n)是一个向量,所以此处以及下文中用y(n)代替Y(n),第t个分量是1,其余的分量全为0,即表示y(n)的第t个分量,并且的值是1,表示数据X(n)的类别是t;Θ表示所有的模型参数。上述目标函数旨在求使在当前模型参数下,对于输入的样本X(n),标签为y(n)的概率最大。
根据条件概率公式得:
目标函数对模型参数的导数:
为了计算(17),需要分别计算(17)式中第二个等号右边的三个部分:
p(H|X(n),y(n)),p(y,H|X(n))。
下面分别计算这三个部分:
●计算
其中由(1)式的:
上面(18.1)~(18.6)为矩阵中每个元素的计算方式。
●计算p(H|X(n),y(n)):
因为的结果中都含有hkl,hkl是矩阵变量H中的一个元素。
所以这里有:
上式为矩阵H中每一个元素的计算方式。
●计算p(y,H|X(n)):
先化简:
上式分子y表述某一具体的类别;分母上的y*表示要遍历所有的类别。
其中分子:
至止,可得式(17)中目标函数对各个参数的偏导数,带入(18),(19),(20)的计算结果到(17)中即可。
鉴于(18.6)特殊性,这里单独给出:
其中,p(yt|X(n))表示由训练数据X(n)计算得到的第t类的概率值。
最后用梯度上升法优化使目标函数最大化,将(17)式的各个结果带入下式中更新:
其中θ∈Θ,λ是学习率,进行多次迭代后,得到优化后的模型即可。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810336621.5/1.html,转载请声明来源钻瓜专利网。





