[发明专利]层级目标定向因果发现方法、装置及电子设备在审
申请号: | 202210119084.5 | 申请日: | 2022-02-08 |
公开(公告)号: | CN114548407A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 代宇;刘贝;蒋磊;孟晓楠;黄力;温鹏;许林江;谢辉志 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06N5/00 | 分类号: | G06N5/00 |
代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 闫雪薇 |
地址: | 310052 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 层级 目标 定向 因果 发现 方法 装置 电子设备 | ||
本公开实施例提出了一种层级目标定向因果发现方法、装置及电子设备。该方法包括:设定目标因子;获取所述目标因子的第一原因因子集;对于所述第一原因因子集中的每一第一原因因子,通过条件检验算法对所述第一原因因子与所述目标因子之间的因果关联性进行计算;根据因果关联性超出第一设定阈值的第一原因因子,生成因果发现结果。
技术领域
本公开实施例涉及数据挖掘技术领域,更具体的,涉及一种层级目标定向因果发现方法、装置及电子设备。
背景技术
随着社会进步和科技发展,人们需要认识的事物变得越来越复杂,系统内部的因果关系是客观存在的,因果发现就是从数据中心挖掘其蕴含的因果关系,从而帮助认门认识事物间的客观规律。
相关技术中,探寻因果关系的方式通常是基于历史数据来挖掘因子之间的因果关系。例如,可以将因果发现问题转化为连续组合优化问题,但在这种解决方案中,需要生成平方量级的节点矩阵,在节点出入度较高的情况下,运行计算需要较大的内存空间,容易导致内存溢出。
因此,有必要提出一种新的因果发现方法。
发明内容
本公开实施例提供一种层级目标定向因果发现的方法,使得因果发现方法更具有针对性,且能节省因果发现算法所需的内存空间,节省计算开销。
根据本公开实施例的第一方面,提供了一种层级目标定向因果发现方法,包括:
设定目标因子;
获取所述目标因子的第一原因因子集;
对于所述第一原因因子集中的每一第一原因因子,通过条件检验算法对所述第一原因因子与所述目标因子之间的因果关联性进行计算;
根据因果关联性超出第一设定阈值的第一原因因子,生成因果发现结果。
可选地,所述获取所述目标因子的第一原因因子集,包括:
获取多个第二原因因子;
计算每个所述第二原因因子与所述目标因子之间的第一相关性,并计算每个所述第二原因因子的树模型特征重要性值;
根据所述第一相关性大于第二设定阈值的第二原因因子,以及对应的书模型特征重要性值,得到所述第一原因因子集。
可选地,所述通过条件检验算法对所述第一原因因子与所述目标因子之间的因果关联性进行计算,包括:
从所述第一原因因子集中,获取与所述第一原因因子具有相关显著性的第三原因因子;
在以所述第三原因因子作为条件的情况下,计算所述第一原因因子与所述目标因子之间的第二相关性;
在所述第二相关性的绝对值大于第三设定阈值的情况下,确定所述第一原因因子与所述目标因子之间具有所述因果关联性。
可选地,所述在以所述第三原因因子作为条件的情况下,计算所述第一原因因子与所述目标因子之间的第二相关性,包括:
在所述第三原因因子的数量为一个的情况下,通过分位法计算所述第一原因因子与所述目标因子之间的第二相关性;
在所述第三原因因子的数量为多个的情况下,通过核方法计算所述第一原因因子与所述目标因子之间的第二相关性。
可选地,所述生成因果发现结果之前,所述方法还包括:
在判断当前迭代的层级数未达到设定层级数的情况下,根据因果关联性超出第一设定阈值的所有第一原因因子,生成第二原因因子集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210119084.5/2.html,转载请声明来源钻瓜专利网。