[发明专利]一种基于视觉因果干预的无监督元学习方法在审
申请号: | 202310100194.1 | 申请日: | 2023-02-06 |
公开(公告)号: | CN116246105A | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 于慧敏;齐国栋;卢朝晖;王润发;顾建波 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/778 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视觉 因果 干预 监督 学习方法 | ||
1.一种基于视觉因果干预的无监督元学习方法,其特征在于,具体包括如下步骤:
(1)构建无监督元学习的因果结构模型图,获得输入数据、先验知识与预测输出三者之间的因果关系;
(2)定义先验变量与先验知识一一对应,同时定义先验变量之间具有因果关系,并使用可学习的有向无环图表达这种因果关系;
(3)定义因果空间,将输入图像编码为在因果空间中与先验变量对应的隐含变量,且该因果空间在多张图片对应的隐含变量相加时,其有向无环图的结构不变;
(4)定义干预公式,根据有向无环图,将先验知识的联合概率分布分解为各个因果相关的隐含变量的条件概率分布的乘积;
(5)对当前任务中所有支撑集输入图像进行编码,得到相应的隐含变量,构建位于因果空间中的无监督高斯混合模型,利用无监督的方式,最大化隐含变量的似然概率,然后对隐含变量解码,得到相应的生成图像,最后最大化生成图像和输入图像的相似度,优化模型;
(6)对当前任务中所有支撑集输入图像和查询集输入图像进行编码,得到相应的隐含变量,构建位于因果空间中的高斯混合模型,利用半监督的方式,最大化隐含变量的似然概率,得到查询集输入图像的类别概率。
2.根据权力要求1所述的一种基于视觉因果干预的无监督元学习方法,其特征在于,所述步骤(1)具体为:在无监督元学习的因果结构模型图中,输入数据是预测输出的因,先验知识是输入数据、预测输出的因;且所述先验知识是一种混杂变量,会导致产生了上下文偏差。
3.根据权力要求1所述的一种基于视觉因果干预的无监督元学习方法,其特征在于,所述步骤(2)中的有向无环图模型由求解等式而获得:
Di=hi(D)+Ui,Dj=hj(D)+Uj;
其中,Di、Dj为先验知识D中的第i、j个先验变量,Ui、Uj为可容忍的服从高斯分布的误差,hi和hj为表征因果结构的函数。
4.根据权力要求1所述的一种基于视觉因果干预的无监督元学习方法,其特征在于,所述步骤(3)中的因果空间具体为,假设有n个位于因果空间的隐含变量Z∈Rn×d,且属于同一个有向无环图结构h,若一个权重w∈Rn×1满足|w|=1,则其加权和服从高斯分布,则其表达式为:
其中表示高斯分布。
5.根据权力要求1所述的一种基于视觉因果干预的无监督元学习方法,其特征在于,所述步骤(4)中的干预公式具体为:对于输入图像x,通过编码器并采样得到隐含变量z~p(z|x),然后将输入到有向无环图函数h,并对其约束p(z|h(z)),最后通过分类器得到干预后的预测y:
P(y|do(x))=Ep(z|x)Ep(z|h(z))P(y|z)
其中do(·)为干预符号。
6.根据权力要求1所述的一种基于视觉因果干预的无监督元学习方法,其特征在于,所述步骤(5)中因果空间中的无监督高斯混合模型具体为:
其中,π是K维度权重,μ[K]、为第k个混合模态的平均值和对角协方差,标量是缩放参数。
7.根据权力要求1所述的一种基于视觉因果干预的无监督元学习方法,其特征在于,所述步骤(5)和步骤(6)中最大化隐含变量的似然概率可以通过求解下述优化方程获得:
其中,的闭式集求解方法为迭代使用无监督的期望-最大化步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310100194.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新能源消纳能力评估方法
- 下一篇:发动机缸体生产系统