目录

  • 摘要
  • 背景介绍
  • 方法
  • 去标识化
  • 数据描述
  • 文件名 描述
  • 纳入患者的基线特征
  • 使用说明

数据表介绍doc文档可点此下载 完整数据库及数据表介绍可点此下载

数据表介绍文档内容如下图

mysql病房管理系统总结_数据集

摘要

在重症监护病房 (ICU) 接受治疗的患者会受到密切监测并接受强化治疗。这种积极的监测和治疗将从电子医疗记录和护理图表中生成高粒度数据。这些数据不仅为日常临床实践提供基础设施,还有助于为临床研究提供信息。整合和清理来自各种来源的医疗数据在技术上具有挑战性。虽然西方国家有几个开放访问的重症监护数据库,但中国成年患者缺乏这种数据库。我们建立了一个涉及感染患者的重症监护数据库。这些患者中有很大一部分患有败血症和/或感染性休克。整合包括实验室结果、基线特征、药物、ICD 代码、护理图表和随访结果的高粒度数据,以生成一个综合数据库。该数据库可用于各种临床研究。

背景介绍

感染在重症监护病房 (ICU) 中很常见 [1,2]。由于获得感染的地方,ICU 患者的感染分为两类。一种感染是入住 ICU 时出现的感染,大多数此类患者因发生败血症和/或感染性休克而被转入 ICU [3,4]。另一种感染是ICU入院后获得的感染,也称为医院感染[1]。由于免疫力受损、使用血管内导管和气管插管,危重患者感染的风险增加 [5,6]。无论在何处获得感染,感染都会引起系统性炎症反应 (SIRS)、败血症和感染性休克。这些并发症与死亡风险显着增加有关 [7,8]。尽管败血症已在文献中得到广泛研究 [4,9,10],但由于机密或法律问题,原始数据通常不公开。受限的数据使用为重现和验证结果造成了障碍。

尽管已经创建了几个来自西方国家的开放访问重症监护数据库,以促进科学界的数据共享和重用 [11-15],但缺乏包含中国成年患者的此类数据库。由于中国人口是世界上最多的,探索中国人群的感染/败血症是实现败血症幸存运动提出的目标的关键[16]。此外,数据集,尤其是从电子医疗记录生成的数据集的数量很大。对此类数据集的二次分析可以对感兴趣的疾病产生新的见解 [13,17,18]。因此,创建与感染患者相关的重症监护数据库有助于促进全球合作研究,以揭示对重症患者感染的更多见解。

方法

该研究于2019年1月至2020年12月在中国四川省自贡市第四人民医院进行,并经自贡市第四人民医院伦理委员会批准(批准文号:2020-065)。数据集中包括年龄 > 18 岁且已转移到索引医院 ICU 的患者。由于研究的回顾性设计,放弃了知情同意。该研究符合赫尔辛基宣言。

被诊断为感染的连续 ICU 患者的电子医疗记录——无论感染发生在何处——都包含在数据库中。感染是根据包含“感染”、“肺炎”和“-itis”等关键词的诊断描述来定义的。由于原始诊断描述是用简体中文记录的,因此实际搜索是在“甘然”和“颜”等等价词上。手动排除一些自身免疫或结缔组织疾病。

去标识化

这些数据在并入重症监护数据库之前被去识别化。所有 HIPAA(健康保险流通与责任法案)都保护健康信息标识符,包括患者姓名、手机/电话号码、地址和任何其他可以在结构化数据源中唯一识别个人的变量。关键变量 PATIENT_ID 和 INP_NO 被随机分配一个唯一编号,并删除了原始患者 ID 和医院 ID。

事件时间点被替换为从入院时间开始以小时为单位测量的偏移值(即入院时间是零点)。原始时间点已从数据集中删除。年龄大于 89 岁的患者被分配一个从 90 到 120 的随机数字作为年龄变量。

数据描述

重症监护数据库填充了在常规临床实践中获得的数据,因此数据库的建立不会干扰临床实践,也不会增加医疗保健负担。数据从多个信息系统导出,包括电子医疗记录 (EHR)、医院信息系统 (HIS)、实验室信息系统 (LIS) 和重症监护护理图表系统。

重症监护数据库作为逗号分隔值 (CSV) 文件的集合提供。此类文件可以使用 PostreSQL、MySQL、R 和 MonetDB 等流行语言脚本轻松处理。数据以“.csv”格式排列成六个数据表(表 1)。这些数据表通过唯一的患者键(即 INP_NO 或 PATIENT_ID)相互链接。

文件名 描述

dtBaseline.csv:该数据表包含有关个体患者基线特征的数据。一条线代表一个患者条目。

dtDrugs.csv:该数据表包含来自 HIS 的数据,是医生开出的医嘱。数据时间代表处方时间,不一定是给药时间。

dtICD.csv:此数据表包含 ICD 代码和诊断说明。描述是从中文翻译过来的。Status_Discharge:列描述了每个单独诊断的状态。如果患者在出院时死亡,对于所有诊断,Status_Discharge 将被编码为“死亡”。该表可用于计算医院死亡率。

dtLab.csv:列出了实验室变量以及每个项目的参考范围。

dtTransfer.csv:数据表包含不同科室之间的转移信息,即从消化科到ICU。

dtNursingChart.csv:护理图表包含床边护士的各种录音。进度笔记是用中文写的,可用于自然语言处理。

dtOutcome.csv:纳入患者的结果。特别是其中包含SF-36问卷,该问卷是出院后通过随访获得的。

纳入患者的基线特征

出院时的总死亡率为 5.8% (161/2790)。非幸存者的男性比例高于幸存者(70% 对 59%;p = 0.014)。肺炎患者比其他感染部位更容易死亡。然而,非幸存者在医院和重症监护室的住院时间均较短,这是由于许多重症患者选择退出生命支持干预并在治疗几天后不久死亡。

使用说明

该数据集尚未用于临床研究。该数据库可用于风险因素分析、验证其他机构开发的早期预警评分和预测分析。长期功能结果尚未在以前的重症监护数据库中建立,这在当前研究中得到了强调。

该数据库受到其追溯性质的限制,并且在许多变量中存在缺失值。此外,呼吸机参数没有以高粒度记录,也没有提供波形。