[发明专利]用于估计观测变量之间的因果关系的方法、装置和系统在审
申请号: | 201710917705.3 | 申请日: | 2017-09-30 |
公开(公告)号: | CN109598346A | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 刘春辰;冯璐;卫文娟 | 申请(专利权)人: | 日本电气株式会社 |
主分类号: | G06N5/04 | 分类号: | G06N5/04 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;庞淑敏 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 观测变量 因果关系 拟合 观测数据 加权因子 不一致 稀疏度约束 有向无环图 估计误差 目标变量 网络结构 最小成本 敏感度 最优化 求解 推理 稀疏 响应 | ||
公开了一种用于估计观测变量之间的因果关系的方法、装置和系统。根据本公开的方法,响应于接收到观测变量的观测数据,基于对利用所述观测变量进行拟合时的拟合不一致度以及对因果网络结构的稀疏度约束,确定用于因果关系目标式。该拟合不一致度基于观测变量的加权因子进行调整,所述观测变量的加权因子表示使用除该观测变量之外的其他观测变量来拟合目标变量所需的最小成本的下限。然后利用观测数据,通过稀疏因果推理,在有向无环图约束下,对因果关系目标式进行最优化求解,以估计多个观测变量之间的因果关系。利用本公开,可以降低因观测变量估计误差而引起的敏感度,得到更加精确的因果关系。
技术领域
本公开涉及数据挖掘技术领域,更特别地涉及一种用于估计观测变量之间的因果关系的方法、装置和系统。
背景技术
在大数据时代,可以通过各种数据采集途径获得大量的数据。通过对这些数据进行数据分析与挖掘,可以得到很多有用的信息。然而,在众多应用领域中,人们往往只能看到系统的表象,却无法洞察系统背后复杂的作用机理及作用过程,而是仅能获得经验型的理解。
因果结构学习致力于基于系统的观测数据,自动还原系统背后复杂的作用机理,还原数据生成过程。目前,因果结构学习技术已被应用于制药、制造、市场分析等多个领域,以便洞察系统本质,继而指导决策,创造价值。
在因果结构学习中可以采用各种类型的模型,其中比较常用的包括结构方程模型、布尔可满足因果模型和贝叶斯网络因果模型。
结构方程模型是当前用于因果结构学习的一种流行方法,例如LiNGAM模型,CAM模型,ANM模型等都属于结构方程模型。然而,这种类型的模型需要依赖启发式方法学习因果序列知识,因此会导致因果结构学习精度的损失。
布尔可满足因果模型是近年来新提出的用于因果结构学习的一种新方法,它基于布尔逻辑推理精确判定因果结构。然而,此类方法受限于逻辑推理复杂度问题,因果学习时效性较差,且无法应用于观测变量维度较高的复杂因果结构学习。
贝叶斯网络因果模型是另一类被广泛运用的方法。传统的贝叶斯因果学习利用准确的推理算法支持因果结构的高精度求解。传统的贝叶斯网络因果模型仅仅适合于中、低维度的因果关系学习,难以应用于高纬度的复杂因果结构学习。而且其推理时效性不好,通常需要利用额外算法来加速推理过程。
在Jing Xiang和Seyoung Kim等人发表的“A*Lasso for Learning a SparseBayesian Network Structure for Continuous Variables”中,提出了一种利用A*Lasso算法来进行因果推理的方式。如图1所示,在该方案中,首先接收观测数据,然后基于使用利用观测变量进行拟合时的拟合不一致度和稀疏约束来执行稀疏因果结构建模,并利用A*Lasso搜索执行因果推理。此外,还通过设定候选因果序列数目的门槛值,来缩减最优因果序列搜索的搜索空间,来加速因果推理。
然而,已有的因果建模方法对不同观测变量的估计误差非常敏感当观测变量取值量级存在较大差异或者在对变量的估计存在误差时,因果结构学习的精度会显著下降。此外,已有推理算法时间复杂度高,无法支持观测变量维度较高的复杂因果结构学习。
为此,在本领域中存在针对估计观测变量之间的因果关系的新技术方案的需求。
发明内容
有鉴于此,本公开提出了一种用于估计观测变量之间的因果关系的方法、装置和系统,以至少部分上消除或者缓解现有技术中的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电气株式会社,未经日本电气株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710917705.3/2.html,转载请声明来源钻瓜专利网。