文章目录

  • 图模型
  • 结构因果模型
  • Intransitive case
  • 链状结构
  • 叉状结构
  • 对撞结构
  • D-分隔
  • 模型检验和等价类
  • 乘积分解法则
  • 混淆变量
  • 观测数据和试验数据



图模型

cem 因果推断 因果推断入门_cem 因果推断


cem 因果推断 因果推断入门_算法_02


cem 因果推断 因果推断入门_cem 因果推断_03


cem 因果推断 因果推断入门_自动驾驶_04


cem 因果推断 因果推断入门_自动驾驶_05


cem 因果推断 因果推断入门_cem 因果推断_06


cem 因果推断 因果推断入门_算法_07


cem 因果推断 因果推断入门_数据_08

结构因果模型

cem 因果推断 因果推断入门_数据_09


x:treatment

cem 因果推断 因果推断入门_cem 因果推断_10


cem 因果推断 因果推断入门_自动驾驶_11

cem 因果推断 因果推断入门_cem 因果推断_12


因果的发生是有先后顺序的

cem 因果推断 因果推断入门_算法_13


cem 因果推断 因果推断入门_数据结构_14


cem 因果推断 因果推断入门_cem 因果推断_15


cem 因果推断 因果推断入门_数据_16


cem 因果推断 因果推断入门_cem 因果推断_17


(外生变量,内生变量)

cem 因果推断 因果推断入门_cem 因果推断_18


cem 因果推断 因果推断入门_算法_19


cem 因果推断 因果推断入门_数据结构_20


cem 因果推断 因果推断入门_cem 因果推断_21


cem 因果推断 因果推断入门_cem 因果推断_22


cem 因果推断 因果推断入门_数据_23

Intransitive case

cem 因果推断 因果推断入门_数据结构_24


cem 因果推断 因果推断入门_cem 因果推断_25

链状结构

cem 因果推断 因果推断入门_cem 因果推断_26


cem 因果推断 因果推断入门_算法_27


cem 因果推断 因果推断入门_算法_28


cem 因果推断 因果推断入门_算法_29


cem 因果推断 因果推断入门_数据_30


cem 因果推断 因果推断入门_数据_31


cem 因果推断 因果推断入门_cem 因果推断_32


cem 因果推断 因果推断入门_数据结构_33

cem 因果推断 因果推断入门_算法_34


cem 因果推断 因果推断入门_算法_35

叉状结构

cem 因果推断 因果推断入门_数据_36


cem 因果推断 因果推断入门_数据_37


cem 因果推断 因果推断入门_算法_38


cem 因果推断 因果推断入门_数据结构_39


cem 因果推断 因果推断入门_自动驾驶_40


cem 因果推断 因果推断入门_数据_41


cem 因果推断 因果推断入门_cem 因果推断_42


cem 因果推断 因果推断入门_数据结构_43


cem 因果推断 因果推断入门_算法_44


Ex<-Age->Ch 统计相关

Ex->Ch因果相关

应该关注分组数据下面这种情况都是因果通路(上:间接影响;下:直接影响),应该关注整体数据

cem 因果推断 因果推断入门_cem 因果推断_45

如果condition在age上

cem 因果推断 因果推断入门_数据_46

对撞结构

XZ、YZ相关,XY不相关;给定Z时,XY相关

cem 因果推断 因果推断入门_自动驾驶_47


cem 因果推断 因果推断入门_数据结构_48

cem 因果推断 因果推断入门_数据_49


cem 因果推断 因果推断入门_cem 因果推断_50


举例:X指的是A给我打电话,Y指的是B给我打电话,Z如果是一个人给我打电话,那么XY不再独立

cem 因果推断 因果推断入门_自动驾驶_51

cem 因果推断 因果推断入门_自动驾驶_52


cem 因果推断 因果推断入门_数据_53

D-分隔

cem 因果推断 因果推断入门_算法_54


unblock—dependent相关的

block(阻断)-独立的

cem 因果推断 因果推断入门_自动驾驶_55


这里的X和Y是两个变量,在有向图中看作两个节点

1.对撞是使得路径断开

2.链和叉结构不阻断路径

cem 因果推断 因果推断入门_数据结构_56


cem 因果推断 因果推断入门_数据结构_57

cem 因果推断 因果推断入门_算法_58


cem 因果推断 因果推断入门_自动驾驶_59


cem 因果推断 因果推断入门_自动驾驶_60


cem 因果推断 因果推断入门_数据结构_61


cem 因果推断 因果推断入门_cem 因果推断_62


cem 因果推断 因果推断入门_自动驾驶_63


cem 因果推断 因果推断入门_cem 因果推断_64


cem 因果推断 因果推断入门_cem 因果推断_65


cem 因果推断 因果推断入门_数据结构_66

模型检验和等价类

模型检验

cem 因果推断 因果推断入门_数据结构_67


图可以推出任意两个节点的统计相关性。数据可以进行统计分析,估计变量的统计相关性。若二者出现不一致问题,则可以认为模型假设错误。

例子:

cem 因果推断 因果推断入门_cem 因果推断_68


cem 因果推断 因果推断入门_算法_69

等价类:

cem 因果推断 因果推断入门_算法_70


说明单从统计相关角度是无法区分fork和chain

cem 因果推断 因果推断入门_数据_71

cem 因果推断 因果推断入门_数据_72


fork和collider可以统计检验

cem 因果推断 因果推断入门_数据_73

cem 因果推断 因果推断入门_数据_74

  1. 链状结构与叉状结构是无法区分的,即等价;
  2. 链状结构和叉状结构与对撞结构是可以区分的,即不等价;
  3. 对状结构的相邻父节点存在有向边是无法区分的,即等价;

例子:

cem 因果推断 因果推断入门_数据_75


把上面的等价类的部分全部去掉以后,下面并不等价。

乘积分解法则

cem 因果推断 因果推断入门_算法_76


cem 因果推断 因果推断入门_算法_77


例子:

cem 因果推断 因果推断入门_自动驾驶_78


cem 因果推断 因果推断入门_数据_79

混淆变量

cem 因果推断 因果推断入门_cem 因果推断_80


cem 因果推断 因果推断入门_数据结构_81

同时影响原因变量与结果变量的变量,称为混淆变量。

例子:

cem 因果推断 因果推断入门_自动驾驶_82


cem 因果推断 因果推断入门_cem 因果推断_83


cem 因果推断 因果推断入门_cem 因果推断_84


cem 因果推断 因果推断入门_数据结构_85


因为confounder的存在,我们无法判别因果关系。 比如溺水人数和冰激凌销量是正相关的,但由于confounder的存在,无法推断因果性。可以通过随机试验的方式吧confounder去掉。另一个例子:

cem 因果推断 因果推断入门_cem 因果推断_86


血压不是混淆变量,因为其是原因变量导致而影响结果变量。

cem 因果推断 因果推断入门_算法_87

怎么剔除confounder

cem 因果推断 因果推断入门_数据结构_88


数据获取方式:

1. 观测数据,只是记录数据,不会数据的产生进行干涉;

2. 试验数据,对试验对象进行干涉,例如对照试验;观测数据难以使用因果推断,试验数据易于使用因果推断。因此在随机试验中对试验对象进行干预,使得变量单一,便可剔除混淆变量。但是并不是所有的试验都可以通过随机试验来获得试验数据,而是通过观测数据。

cem 因果推断 因果推断入门_cem 因果推断_89


cem 因果推断 因果推断入门_自动驾驶_90


实验数据必须进行干预,改变数据的生成机制。AB test:

cem 因果推断 因果推断入门_数据结构_91


cem 因果推断 因果推断入门_cem 因果推断_92


cem 因果推断 因果推断入门_数据_93

观测数据和试验数据

cem 因果推断 因果推断入门_数据结构_94


cem 因果推断 因果推断入门_cem 因果推断_95


cem 因果推断 因果推断入门_数据结构_96


cem 因果推断 因果推断入门_算法_97


cem 因果推断 因果推断入门_cem 因果推断_98


随机化lifestyle,营养品和健康之间的相关性才是因果性。