在医学科研、特别是观察性研究领域,无论是现况调查、病例对照研究、还是队列研究,经常遇到分类的健康结局,包括二分类(如:生存与死亡、阳性与阴性、发病与未发病)或者一些可进行分类的生理生化指标等(如:血压值、血镁值、血脂和胆固醇等)时,线性回归分析往往无法进行,此时可以考虑Logistic回归模型。
logistic回归分析报告的统计模块主要包括3部分内容:统计描述、差异性分析、logistic回归。完成这三步,基本就可以形成一份统计报告了!
实际中,许多人习惯性使用SPSS进行回归分析,但是SPSS无法进行批量单因素分析,还需要手动绘制三线表,费时又费力。而R语言虽然可以解决以上难点但具有一定的门槛,因此,这里结合一篇文献与实操案例为大家介绍一个智能在线免费统计分析平台——风暴统计。
本文主要内容包括: 一、实操案例介绍 二、风暴统计智能在线免费平台复现 |
一、实操案例介绍
接着我们将结合实操数据集对上述传统logistic回归分析文章的统计框架进行复现。
数据集来源于R自带MASS数据集birthwt,这是一份于1986年在在马萨诸塞州收集的与婴儿出生体重低相关的危险因素的数据。根据婴儿出生体重是否小于2.5kg,分为低出生组(59例)与正常组(130例)。研究的暴露因素见下表。
下面将结合本数据通过风暴统计智能在线免费平台来进行统计框架复现,方便大家对两种方法的特点有更加直观的认识!
二、风暴统计智能在线免费平台复现
(1)进入风暴统计平台
首先通过电脑端浏览器进入风暴统计平台,依次点击网“风暴智能统计”——“logistic回归分析”——“logistic回归”。
(2)导入数据集
目前支持10 M 以内的csv或excel格式。
(3)数据的整理转换
本片案例数据不涉及数据的整理,因此这里不再赘述,感兴趣的朋友可以点击下方链接,之前的文章中有详细的介绍。
(4)分类变量参照组设置
设置对照组,对变量race中“1=white”设置为对照组。
拖动“1”,“2”,“3”的小方块可以调换位置。排序第一位的为对照组。
(5)分组差异性比较
指定不同的变量类型。风暴统计可以自动检验分类变量使用卡方法或fisher法!并在“statistic”注明检验统计量。
此外,可以导出word版结果,结果直接呈现三线表形式,包括表名与表头一步到位。如需细节打磨,word形式方便进行编辑!
word版结果如下:
(6)logistic回归分析
①指定因变量与自变量的变量类型
②指定logistic回归方式
当不指定先单后多P值限制时,所有变量都可进入多因素回归模型。可点击下方菜单栏,分别查看单因素回归结果、多因素回归结果、单因素+多因素在同一表格结果。表格中的P值出现0.000时,会自动调整会规范表达:<0.001,省时又省心!
同理,可以选择先单后多的回归方式,这个方法比较传统也是大家习惯性用的比较多的。那么什么时候推荐用逐步回归呢?有以下2种情况,可以考虑使用:①探索性研究、探讨多个影响因素时,候选的影响因素实在太多(单因素分析后P值<0.05者,仍然超过10个),或者样本量不大。②构建预测模型时候,就放心大胆的用。其他场景,一般不建议用逐步回归法。可以先单因素后多因素,控制自变量个数。
这里由于自变量个数不多,我们采用先单后多的方式进行筛选。
③导出word版结果
风暴统计结果结果展示如下,直接生成word版三线表,高效快速!
有需求的各位,不妨花3分钟事件时间试一试,风暴统计平台是以R代码为基础搭建的智能在线医学统计分析平台,准确度方面十分有保障!