目录

  • 1. 简介
  • 2. 命令介绍
  • 3. Stata 实例
  • 3.1 IVW 估计应用
  • 3.2 Egger 回归应用
  • 3.3 中位数估计应用
  • 3.4 漏斗图示例
  • 3.5 Leave-one-out 分析可视化应用
  • 4. 结语
  • 5. 参考资料
  • 6. 相关推文

1. 简介

孟德尔随机化法 (Mendelian randomization,MR) 已经发展成为检验流行病学因果推断关系的一种有效方法。MR 方法通过使用遗传变异作为工具变量 (IV) 来推导暴露与结果变量之间的因果关系。要使得 MR 方法实现有效无偏估计,需要满足三条假设:

  • 工具变量必须与暴露变量相关;
  • 工具变量和结果变量不能有混杂因素;
  • 工具变量不能影响结果变量,工具变量只能通过暴露变量与结果变量相关。

本文介绍了 Stata 的 mrrobust 软件包,可以实现双样本 MR analyses 分析过程。在 Stata 中,可以使用 IVREG2 实现两个样本等模块的单个级别 IV 分析。mrust 软件包解决了这一限制,提供了一套流行的双样本 MR 方法和灵敏度分析。接下来,本文将简要介绍几种 MR 估计方法。

考虑 MR 研究中关于遗传变异基因样本 ,存在连续暴露变量  和结果变量 。所有混淆因素都包含在变量  中。假设所有的遗传变体都是有效的 IV,并进一步假设变量之间的所有关系都是线性的,且不存在异质性 (Bowden 等,2016):

假设所有的变异都与暴露变量有关,则对于所有的  有 。参考 Bowden 等 (2016),设定 。误差项  和  为正态分布,存在相关性,包含混杂项  和 。

逆方程加权估计 (IVW) 估计:暴露变量  对结果变量  的因果影响,可以使用第  个变量作为遗传结果关联和基因暴露关联估计的比率来估计:

如果遗传方差满足 IV 假设,则 ,并且比率估计是渐近一致的。此外,如果遗传变异是不相关的,则可以使用 meta-analysis 中的公式将来自每个遗传变异的比率估计值组合成总体估计值:

其中  是变量  的基因-结果关联估计的标准误差,这被称为逆方差加权 (IVW) 估计量。假设遗传变异是不相关的,IVW 估计与通常用于个体水平数据的两阶段最小二乘估计渐近相等。如果所有的遗传变异都满足 IV 假设,则 IVW 估计是因果效应的一致估计 (即,随着样本量的增加而收敛到真值),因为它是个体比率估计的加权平均值。

Mr-Egger 回归估计:Bowden 等 (2015) 提出了一种对加总数据进行 MR 的稳健方法,即 Mr-Egger 回归。这种方法源于 Meta 分析文献中用于评估小型研究偏差 (发表偏倚) 的一种方法 (Egger 等,1997),该方法会对基因暴露系数  上的基因结果系数  进行加权线性回归:

其中所有的  关联被设定为正,并且回归中的权重是基因-结果关联的逆方差 。如果回归模型中没有截距项,则 MR-Egger 斜率估计  将等于 IVW 估计。

中位数估计:当所有的遗传变异都是有效的 IV 估计时,IVW 估计是一种有效的分析方法。但是,即使只有一个基因变异是无效的,它也是有偏见的。因此,IVW 预估可以说是有 0% 的细分水平。中位数估计比率提供了对因果效应的一致估计。

具体地说,设  表示第  个有序比估计 (从小到大排列)。如果遗传变异总数为奇数 ,则简单的中位数估计为中比估计 ;如果为偶数 ,则将中位数内插在两个中值估计  之间。具体内容及解释可参见 Bowden 等 (2016) 的图 2,当然中位数估计可以继续升级为加权中位数估计 (Weighted Median Estimator) 和惩罚加权中位数估计 (Penalized Weighted Median Estimator)。