识别和控制混杂

(一)控制混杂的必要性和原理

混杂是一种由于暴露因素对某疾病的作用与其他病因对同一疾病的作用在同一个研究里交织在一起所引起的在暴露效应估计上的误差。混杂是一种偏倚,一种在暴露与结局关系上的偏倚,混杂因素必须同时具备一下三个条件(图2):一、是疾病确定的病因或危险因素,即图2里性别必须是肺癌的真正病因或危险因素;二、不是暴露和疾病关系之间的中间因素,如性别不可能是吸烟和肺癌之间的中间因素;三、在目前的研究中与暴露因素有关,即可疑的混杂因素在暴露组和非暴露组存在差异或叫不可比,如吸烟人群中男性占比高于不吸烟人群。结果是,在研究吸烟与肺癌关系的研究中,如果性别是混杂因素,性别将会扭曲吸烟与肺癌的关系,低估或高估吸烟对肺癌危险的作用。

环境流行病学中暴露反应关系r语言 流行病学暴露因素_环境流行病学中暴露反应关系r语言

图2 流行病学研究中暴露因素、结局事件和混杂因素

在观察性研究里,混杂是普遍的。因此,观察性研究对混杂的控制是必要的,需控制的因素必须首先符合前两个条件,控制的原理是切断第三个条件,即去除可疑危险因素在暴露组和非暴露组之间的区别或迫使它们可比。对于前两个条件的判断,必须基于现有最好的、来自其他研究的发现或证据,而不是根据目前研究中的结果。如果控制了不符合前两个条件的因素,可能会引起不必要的偏倚。切断第三个条件,指在目前研究中切断第三个条件,从研究设计上有三种方法:限制、匹配和随机分组;在数据分析阶段也有三个方法:直接标化法、分层分析和多元回归。

随机分组(random allocation)使随机对照试验中比较组之间所有可能的已知和未知的混杂因素得到平衡和可比,从而同时切断了所有可能的混杂因素的第三个条件,是所有控制混杂的方法中最简单、最有效的方法,因此随机对照试验无需在数据分析阶段采取混杂控制措施。但是,随机分组只能用于干预性研究,不能用于病因研究。其他控制混杂的方法主要适用于非随机分组的对照试验和观察性研究。