文章聚焦于复杂处理设置下因果推断方法的综述性研究,涵盖了多值、连续以及捆绑处理等复杂情况。

  • 首先介绍了问题背景、基本假设及其变化,并对传统的二元处理设置进行了简要回顾。
  • 随后,详细探讨了处理多值、连续和捆绑处理的不同方法,并根据是否遵循无混淆假设将这些方法进行分类。
  • 此外,文中还梳理了可用于研究的公开数据集和开源代码,并指出了该领域面临的挑战与未来探索的方向。

这是首次将这三种复杂处理统一归纳,并提供了全面的文献综述。

复杂处理下的因果推断--综述_生成模型

1 二元处理

二元处理方法一般分为无混淆假设下的方法和存在未观测混杂因素的方法。

(1)无混淆假设下的方法:

  • 基于倾向得分的方法(Propensity Score-based Methods):这种方法的核心思想是通过预测单位接受处理的概率来平衡观察到的协变量。
  • 双重稳健方法(Doubly Robust Methods):这些方法结合了倾向得分和结果回归模型的优点,即使其中一个模型被错误指定也能得到一致的估计。
  • 协变量平衡方法(Covariate Balancing Methods):这类方法旨在确保处理组和对照组之间的协变量分布相似。
  • 树基方法(Tree-based Methods):使用决策树来估计处理效应,能够捕捉复杂的非线性关系。
  • 基于表示的方法(Representation-based Methods):通过学习一种新的表示来减少协变量不平衡的影响。
  • 生成模型方法(Generative Modeling Methods):使用生成对抗网络(GANs)或其他生成技术来模拟数据分布,从而更好地估计因果效应。

(2)存在未观测混杂因素的方法

  • 代理变量法(Proxy Variable):这种方法试图从可获得的数据中恢复未观测到的混杂因素的代理变量,用于辅助因果效应的估计。
  • 工具变量法(Instrumental Variable, IV):寻找一个与处理相关但仅通过处理影响结果的变量作为工具变量,以帮助估计处理对结果的因果效应。

2 多值处理

(1)无混淆假设下的方法:

  • 基于广义倾向得分的方法 (GPS-based Methods):广义倾向得分(GPS)是一种扩展版的倾向得分,适用于处理变量有多个离散值的情况。GPS可以帮助匹配相似的个体或者调整权重以估计平均处理效应。
  • 树基模型 (Tree-based Models):这类方法利用决策树来分析数据,并可以扩展到多类处理情况。例如,CTS方法使用树结构来确定最佳处理值。
  • 基于表示的方法 (Representation-based Methods):这些方法通过学习共享平衡表示来减少处理组间的偏差,同时考虑所有处理组的假设函数。例如,VARTS方法就是基于表示的学习方法。
  • 生成建模方法 (Generative Modeling Methods):这类方法使用生成模型,如生成对抗网络 (GAN),来估计多值处理的效果。例如,GANITE方法通过对抗训练来估计处理效果。
  • 元学习方法 (Meta Learning Methods):这些方法利用元学习框架来提高跨域的一般化能力。MetaITE方法就是在元学习框架下的一种方法,它通过构建支持集和查询集来优化模型。

(2)存在未观测混杂因素的方法

  • 基于信息的多重因果估计 (MCEI):这种做法尝试恢复未观测混杂因素的代理变量。它包括两个假设:一是所有处理共享相同的混杂因素;二是给定混杂因素后处理之间相互独立。MCEI通过最大化一个目标函数来估计潜在的结果,该目标函数考虑了处理和未观测混杂因素之间的附加互信息。

复杂处理下的因果推断--综述_sed_02

3 连续处理

(1)无混淆假设下的方法

  • 加权方法:受到逆概率加权(IPW)的启发,提出了逆广义倾向评分(IGPS)。为了应对IGPS中可能出现的极端值问题,又提出了稳定版本的SIGPS。
  • 协变量平衡广义倾向评分(CBGPS):这是CBPS的扩展,用于连续处理设置。其目的是消除处理T和协变量X之间的相关性。CBGPS通过确保GPS的平衡属性来达到这个目的。
  • 双重鲁棒方法:这些方法结合了加权方法和回归方法的优点,即使其中一个模型被错误地指定也能提供一致的估计。
  • 基于表示的方法:这些方法通过学习一个低维表示空间来平衡协变量,使得在这个空间内处理和协变量之间的关系变得不相关。
  • 生成建模方法:这些方法通常使用生成对抗网络(GANs)或其他生成模型来模拟处理和结果之间的分布,从而估计因果效应。

(2)存在未观测混杂因素的方法

  • 基于代理变量的方法:当无法直接观察到所有混杂因素时,可以寻找与混杂因素相关的代理变量来帮助估计因果效应。
  • 基于辅助变量的方法:辅助变量是指与处理和结果都相关的变量,但不是混杂因素。它们可以用来改善估计。
  • 基于空处理的方法:这种方法通过引入一个假想的“空”处理来帮助估计其他非空处理的影响。
  • 基于似然最大化的方法:这种方法通过最大化似然函数来估计参数,考虑到可能存在未观测的混杂因素。

复杂处理下的因果推断--综述_sed_03

4 捆绑处理

(1)无混淆假设下的方法

  • 基于表示的方法:这类方法试图通过构建一个表示层来分离不同处理措施的影响,并通过一个合并层来整合这些影响以计算潜在结果。
  • 神经反事实关系估计(NCoRE):借鉴了TARNet的设计,为每个处理建立一个单独的“臂”,并通过一个合并层将所有相关处理臂的输出结合起来以预测潜在结果。
  • 生成建模方法:这类方法利用生成模型(如变分自动编码器,VAE)来学习处理的潜在表示,并使该表示与协变量解耦,以减少混杂偏差。
  • 变分样本重加权(VSR):使用VAE学习处理的潜在表示,并通过变分样本权重来去除协变量与处理间的相关性。

(2)存在未观测混杂因素的方法

  • 基于代理变量的方法:通过找到与未观测混杂因素相关的代理变量来帮助估计因果效应。
  • 基于辅助变量的方法:使用与处理和结果都相关的辅助变量来改进估计。
  • 基于空处理的方法:通过引入一个假想的“空”处理来帮助估计其他非空处理的效果。
  • 基于似然最大化的方法:通过最大化似然函数来估计参数,考虑可能存在的未观测混杂因素。

复杂处理下的因果推断--综述_生成模型_04

5 结语

文章全面回顾了处理复杂治疗设置下的因果推断方法,包括多值、连续和捆绑治疗,并探讨了现有数据集、开源代码及未来研究方向。

论文题目: Causal Inference with Complex Treatments: A Survey

论文链接: https://arxiv.org/abs/2407.14022


PS: 欢迎大家扫码关注公众号_,我们一起在AI的世界中探索前行,期待共同进步!

复杂处理下的因果推断--综述_生成模型_05

精彩回顾

1. 探索用于多类无监督异常检测的状态空间模型

2. 一种用于治疗性肽生成的多模态对比扩散模型

3一种针对自然语言文本的提示策略