关于因果关系的识别,前面介绍了一些方法:随机对照试验、后门调整、前门调整、do-演算。今天介绍另一种进行因果效应识别的另一种方法:工具变量。
1. 什么是工具变量?
上面的因果图中,就是一个工具变量,可以利用它在观测不到的情况下计算对的因果效应。
工具变量的标准:
- (Relevance)是的直接原因。
- (Exclusion Restriction)对的因果效应由完全介导。
- (Instrumental Unconfoundedness)到没有畅通无阻的后门路径。
一个变量满足上述工具变量标准,才能成为一个工具变量,才能利用其进行因果关系的识别。
2. 工具变量不能进行ATE的无参识别
与第五章介绍的ATE识别的方法相比,工具变量无法对ATE进行无参识别。当使用后门调整、前门调整和do-演算识别ATE时,我们无需对参数形式或者说结构变量做任何假设,但工具变量对ATE的识别必须建立在对参数形式(例如,线性)的假设之上。
因果效应可以被无参识别的必要条件是:到其后代也是的祖先的节点的后门路径是可以被阻断的(见第五章最后)。在上面的因果图中,是的子代,并将其看成自己的祖先,到的后门路径由于观测不到而无法被阻断,因此对的因果效应不能被无参识别。
3. 二元线性设置下工具变量识别ATE
首先介绍最简单的情况:二元线性设置下用工具变量识别ATE。
假设:,假设和都是二元变量。
根据假设,对的因果效应为,我们需要根据估计的值。
在计算过程中把直接删掉是因为根据工具变量标准的第三条,与是相互独立的。于是,
注意,根据工具变量标准的第一条,上式中的分母不为零。
然后,我们插入经验平均值来代替这些条件期望值,得到Wald估计量:
其中,是的样本数,是的样本数。
4. 连续线性设置下工具变量识别ATE
同样假设,当和都是连续的的时候,
证明:
5. 工具变量无参识别局部ATE
根据Principal Strata,将数据分为四层:
- Compliers -
- Always-takers -
- Never-takers -
- Defiers -
Local ATE(LATE, Complier Average Causal Effect (CACE))的定义:
Monotonicity假设:,这个假设的意思就是没有defier。
基于上面的假设,我们可以得到局部ATE:
证明:
按照Principal Strata将数据分为四层,
对于always-takers和never-takers,和是独立的,因此对也没有因果效应,因此消去它们。根据假设,没有defiers,因此,消去它们。
现在,我们可以得到,对于compliers,对的因果效应为:
因为是compliers,所以且,因此,因为没有compliers,可以用总概率减去always-takes和never-takers得到compliers的概率。于是,
上面计算局部ATE的方法仅局限于:
- 线性
- 满足Monotonicity假设
6. ATE识别的更一般设置