[发明专利]一种基于测地线度量的流形网络建模可解释性方法在审
申请号: | 202011502227.8 | 申请日: | 2020-12-18 |
公开(公告)号: | CN114723956A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 史泽林;向伟;刘天赐;刘云鹏;蓝德岩;刘鑫 | 申请(专利权)人: | 中国科学院沈阳自动化研究所 |
主分类号: | G06V10/42 | 分类号: | G06V10/42;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 沈阳科苑专利商标代理有限公司 21002 | 代理人: | 王倩 |
地址: | 110016 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 地线 度量 流形 网络 建模 解释性 方法 | ||
1.一种基于测地线度量的流形网络建模可解释性方法,其特征在于包括以下步骤:
1)将样本图像进行预处理,获得对应样本的图像特征,建立图像的黎曼流形特征空间;
2)将黎曼流形特征空间矩阵作为深度学习网络的输入,经过卷积层进行训练,并得到每个卷积层对应的特征空间;
3)在正向传播阶段,构建黎曼流形特征空间的梯度模型并传递深度学习网络的参数;
4)在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新深度学习网络参数;
5)基于黎曼流形特征空间的测地线距离,定义每层特征空间的流形空间弯曲程度,通过流形弯曲程度指标的计算结果,对深度学习网络模型的有效性原理做出可解释性分析。
2.根据权利要求1所述的一种基于测地线度量的流形网络建模可解释性方法,其特征在于,所述建立图像的黎曼流形特征空间,包括以下步骤:
对于深度学习网络,每次训练阶段的图像组中包含n张训练样本,即该次的训练图像集可表示为Iset={I1,I2,…,In},提取图像集中每幅图像Ii对应的特征,构成特征向量i=1,2,…,n,vi代表每幅图像的d维图像特征向量;
每个图像集Iset的图像集特征矩阵X可表示为X=[v1,v2,…,vn],特征空间可表示为d×r维数的Grassmann流形矩阵:其中fQR(X)为X的QR正交分解函数,输出Q0为X分解后得到的正交矩阵。
3.根据权利要求1所述的一种基于测地线度量的流形网络建模可解释性方法,其特征在于:将具有Grassmann流形结构的特征空间矩阵输入至深度学习网络进行训练,包括以下步骤:
Grassmann流形矩阵Q0作为输入,即Q0为输入的高维流形,Y为学习到的新流形作为输出,则对于流形学习层,有:Y=f(Q0)=WTQ0,其中待学习的W为变换矩阵;
将流形学习层的输出Y作为流形转换层的输入,经过流形转换层输出为Q,即有fQR(Y)=YR-1=Q,其中fQR(Y)为Y的QR正交分解函数,输出Q为Y分解后得到的正交矩阵;
Q输入至欧氏映射层得到M,则有M=fpro(Q)=QQT,其中fpro(Q)为映射函数;
将M作为全连接层的输入,再经过softmax层传递至代价函数。
4.根据权利要求1所述的一种基于测地线度量的流形网络建模可解释性方法,其特征在于,所述在正向传播阶段,构建黎曼特征空间的梯度模型并传递深度学习网络的参数,包括以下步骤:
Wt+1=Γ(Wt-λgradRL(W))
其中,Wt+1表示下一次更新的权值参数,Wt为当前第t次迭代的权值参数,Γ(·)表示拉回映射算子,λ表示学习速率,gradRL(W)表示黎曼梯度,是流形学习层的代价函数L(W)关于W的欧氏梯度的正则成分;
根据矩阵链式法则求得相应的欧氏梯度的表达式为:
其中L(Y)表示流形转换层的代价函数;
将Wt+1带入步骤2)中的学习变换矩阵W,实现学习变换矩阵的更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院沈阳自动化研究所,未经中国科学院沈阳自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011502227.8/1.html,转载请声明来源钻瓜专利网。