我们知道ROC曲线常用来分析某连续变量用于疾病诊断的价值,有时候诊断价值往往受某些变量的影响。比如,MMSE用于痴呆筛查的诊断价值,可能与人群年龄分布、教育程度分布相关。为了验证这一假说,我们可以绘制分组ROC曲线进行直观的观察,并可进行曲线下面积的比较。

以stata软件为例,首先通过“文件-导入”读取数据,小编读取的spss数据。该数据中,y为疾病状态(痴呆、非痴呆)、H1mo为MMSE量表得分、agegroup42为年龄分组、edulev2为教育程度分组。



roc 回归 cox回归roc曲线_取值

导入数据后,通过“统计-流行病学及相关-ROC分析”,选择“两个或更多个ROC区域相等性检验”。



roc 回归 cox回归roc曲线_重命名_02

参考变量即为金标准,取值只有0和1;分类变量为待评价的连续变量,本例中为H1mo;

按变量分组,即是按哪个分组绘制ROC曲线。选择agegroup42表示按年龄分组绘制ROC曲线。选择绘制ROC曲线,并报告ROC曲线下面积。



roc 回归 cox回归roc曲线_sklearn 绘制roc曲线_03

点击“确定”之后,输出结果可查看不同年龄分组间ROC曲线下面积的比较。可见,Prob=0.9440,且不同年龄分组的ROC曲线下面积的95%可信区间存在重叠,提示:不同年龄分组ROC曲线下面积无统计学差异。



roc 回归 cox回归roc曲线_取值_04

在绘图区可查看按年龄分组的ROC曲线,大家可以对图例进行修改。接下来,我们给大家介绍下如何合并多个ROC曲线。首先,我们需要在绘图窗口,通过“编辑-重命名图形”进行重命名,假设命名为a。



roc 回归 cox回归roc曲线_sklearn 绘制roc曲线_05

然后,我们绘制按教育程度分组的ROC曲线,并将其重命名为b。这时候我们可以在绘图窗口看到两个ROC曲线,分别是a和b。我们只需要在stata的命令窗口键入graph combine a b,按下Enter键,即可得到合并后的ROC曲线。



roc 回归 cox回归roc曲线_取值_06

roc 回归 cox回归roc曲线_roc 回归_07

大家可通过点击右键,“启动图形编辑器”进行修改,



roc 回归 cox回归roc曲线_取值_08