[发明专利]用于配对数据的平均处理效应在审
申请号: | 202210898425.3 | 申请日: | 2022-07-28 |
公开(公告)号: | CN115700610A | 公开(公告)日: | 2023-02-07 |
发明(设计)人: | D.巴塔查嘉;D.苏布拉曼尼亚;高天;N.S.马泰 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06N7/01 | 分类号: | G06N7/01;G06N5/04;G16H50/70 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 陈金林 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 配对 数据 平均 处理 效应 | ||
本发明的实施例提供计算机实施的方法、计算机程序产品和计算机系统。本发明的实施例可以识别多变量事件数据集内的多个数据变量。本发明的实施例然后可以使多变量事件数据集内的至少两个所识别的数据变量之间的因果推断形式化,并且基于所识别的数据变量的因果推断的形式化生成用于该多变量事件数据集的平均效应值的结构框架。本发明的实施例然后可以基于所识别的变量的类型、与所识别的变量相关联的预定时间和所识别的变量之间的因果连接强度计算所生成的平均效应的结构框架的反倾向分数。
技术领域
本发明总体上涉及数据配对技术领域,并且更具体地涉及因果推断数据收集技术。
背景技术
数据收集是在已建立的系统中聚集和测量关于目标变量的信息的过程,该过程则使得人们能够回答相关问题并评估结果。数据收集是所有研究领域的调研部分,包括物理和社会科学、人文学和商业。虽然方法因学科而有所不同,但都强调确保准确而诚实的收集。一般而言,所有数据收集的目标都是获取高质量的证据,从而对所提出的问题给出令人信服和可信的回答。
发明内容
根据本发明的各方面,提供了一种计算机实现的方法。该计算机实现的方法包括:识别多变量事件数据集内的多个数据变量;使多变量事件数据集内的至少两个所识别的数据变量之间的因果推断形式化;基于所识别的数据变量的因果推断的形式化,生成多变量事件数据集的平均效应值的结构框架;以及基于所识别的变量的类型、与所识别的变量相关联的预定时间、以及所识别的变量之间的因果连接强度来计算所生成的平均效应的结构框架的反倾向分数。
附图说明
现在将参考以下附图仅通过示例的方式来描述本发明的优选实施例,在附图中:
图1描绘了根据本发明实施例的计算环境的框图;
图2是示出根据本发明至少一个实施例的用于推断一对事件之间的连接强度的操作步骤的流程图;
图3A和图3B描绘了根据本发明至少一个实施例的连接强度的结果;和
图4是根据本发明实施例的示例系统的框图。
具体实施方式
本发明的实施例认识到当前数据收集技术的某些缺陷。具体地,本发明的各实施例认识到,数据收集通常提供用于收集事件数据集的数据的有限覆盖,并且难以将重复的发生识别为事件数据内的结果。通常,当前数据收集技术在生成与数据模型相关联的框架时假定离散时间。本发明的实施例提供了一种解决方案,其通过使多变量事件数据集内的一对数据变量之间的因果推断形式化和基于因果推断的形式化动态地生成针对该多变量事件数据集的平均效应的框架,来提高数据收集的效率并降低当前数据收集技术的数据预测的不准确性。
具体地,本发明的实施例通过学习和量化任何事件对之间的因果效应来改进当前数据收集技术,假设仅在时间线上跨多个事件类型的带时间戳的、异步的、不规则间隔的事件发生数据作为输入。本发明实施例通过以下方式实现这一点:使针对动态相关事件数据集的平均处理效应(Average Treatment Effect,ATE)框架形式化,将ATE框架用于多变量点过程,生成用于重新加权程序(re-weighting procedure)的倾向分数和反倾向分数,以实现更好的ATE估计,该ATE估计调整其他事件协变量(即,可能影响稍后的事件的其他历史发生或事件)的影响。
图1是示出根据本发明一个实施例的计算环境(一般指定为计算环境100)的功能框图。图1仅提供一个实施方式的图示且并不暗示对其中可以实现不同实施例的环境的任何限制。在不脱离权利要求书所阐述的本发明的范围的情况下,本领域技术人员可对所描绘的环境作出许多修改。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210898425.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理方法和系统
- 下一篇:功率分配系统以及用于测定温度曲线的方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置