[发明专利]一种基于测地线度量的流形网络建模可解释性方法在审
申请号: | 202011502227.8 | 申请日: | 2020-12-18 |
公开(公告)号: | CN114723956A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 史泽林;向伟;刘天赐;刘云鹏;蓝德岩;刘鑫 | 申请(专利权)人: | 中国科学院沈阳自动化研究所 |
主分类号: | G06V10/42 | 分类号: | G06V10/42;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 沈阳科苑专利商标代理有限公司 21002 | 代理人: | 王倩 |
地址: | 110016 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 地线 度量 流形 网络 建模 解释性 方法 | ||
本发明公开了一种基于测地线度量的流形网络建模可解释性方法,本发明首先利用黎曼流形对原始图像进行流形特征建模,从而将提取的特征子空间作为深度学习网络的输入;之后,基于特征子空间的测地线距离与反向传播模型,对流形上的深度学习网络进行梯度模型推导,对流形弯曲程度指标进行定义,通过计算深度网络特征层间的测地线距离,最终输出各层特征空间的流形弯曲程度指标。本发明有效利用数据的几何结构,对深度特征的特征空间进行流形建模,从流形空间的几何角度对深度学习的有效性原理进行分析,通过计算深度学习网络特征空间的测地线距离,提供了一种深度学习网络的可解释性方法。
技术领域
本发明涉及深度学习与人工智能技术领域,特别提供了一种基于测地线度量的流形网络建模可解释性方法。
背景技术
近年来,以深度学习为代表的人工智能算法在目标识别、目标跟踪等研究方向所取得的突破进展掀起了人工智能新一轮的发展热潮,深度学习在自动驾驶、医疗、无人机救援等领域得到了广泛应用。深度学习在很多人工智能应用领域中取得成功的关键原因在于,深度网络模型所具有的强大学习能力以及端到端的学习方式。然而,深度学习方法由于其模型内部高度的复杂性常导致人们难以理解模型的决策结果,造成深度学习模型的不易解释性。多年以来,深度学习方法这种通过标注大量数据来进行误差后向传播而优化参数的学习方法被视为黑箱模型,大多数结论确认依赖于大量的工程经验而非理论来确定,当网络模型决策错误时研究人员难以追溯原因以及时对模型作出调整。这一问题同时也意味着在实际工程应用中难以根据任务需求对算法进行改进,阻碍着人工智能领域的发展。因此,研究者们一直致力于更透彻地去理解深度学习模型内部复杂的网络结构及学习过程,从而达到进一步优化模型的目的。
发明内容
鉴于此,本发明的目的在于提供一种基于测地线度量的流形网络建模可解释性方法,以解决深度网络可解释性问题。
本发明提供的技术方案是:一种基于测地线度量的流形网络建模可解释性方法,包括以下步骤:
1)将样本图像进行预处理,获得对应样本的图像特征,建立图像的黎曼流形特征空间;
2)将黎曼流形特征空间矩阵作为深度学习网络的输入,经过卷积层进行训练,并得到每个卷积层对应的特征空间;
3)在正向传播阶段,构建黎曼流形特征空间的梯度模型并传递深度学习网络的参数;
4)在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新深度学习网络参数;
5)基于黎曼流形特征空间的测地线距离,定义每层特征空间的流形空间弯曲程度,通过流形弯曲程度指标的计算结果,对深度学习网络模型的有效性原理做出可解释性分析。
所述建立图像的黎曼流形特征空间,包括以下步骤:
对于深度学习网络,每次训练阶段的图像组中包含n张训练样本,即该次的训练图像集可表示为Iset={I1,I2,…,In},提取图像集中每幅图像Ii对应的特征,构成特征向量vi代表每幅图像的d维图像特征向量;
每个图像集Iset的图像集特征矩阵X可表示为X=[v1,v2,…,vn],特征空间可表示为d×r维数的Grassmann流形矩阵:其中fQR(X)为X的QR正交分解函数,输出Q0为X分解后得到的正交矩阵。
将具有Grassmann流形结构的特征空间矩阵输入至深度学习网络进行训练,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院沈阳自动化研究所,未经中国科学院沈阳自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011502227.8/2.html,转载请声明来源钻瓜专利网。