eICU数据集地址:

https://eicu-crd.mit.edu/about/eicu/

官方指导文档

https://eicu-crd.mit.edu/gettingstarted/access/

步骤一:

该数据集使用需要权限,只有获得相应证书才能下载该数据集 获得相应证书需要完成一些培训课程,培训课程地址:

https://www.citiprogram.org/index.cfm?pageID=154&icat=0&ac=0
机构填Massachusetts Institute of Technology Affiliates

greeplum 修改分区 grep rescue_数据集


依次填写个人信息,在Human Subjects training部分选择Data or Specimens Only Research课程

课程联系的答案见:


练习全都做完了就有结业证书
记得保存结业证书

步骤二:

  1. 在physionet上注册一个帐户:https://physionet.org.如果已有帐户直接登录即可
  2. 转到该数据集的描述页面:https://physionet.org/content/eicu-crd/
  3. 在Files内找到"credentialed user",登陆进去,填写个人信息,并上传证书当你的申请获得批准后,你将收到电子邮件,其中包含从PhysioNetWorks下载数据库的说明。批准可能需要几个工作日

    收到这样的邮件就表明你申请通过了,有时候申请没有通过可能是填写的信息有误,按照要求填写即可,自己的导师信息也要填写,记得邮件地址不要填qq、163、或者google地址,需要填写学术邮件地址,我填的是我们学校给的邮箱地址
    都通过了就可以下载数据集了

https://physionet.org/content/eicu-crd/2.0/

greeplum 修改分区 grep rescue_postgresql_02


总共5GB左右,下载完毕后,将所有压缩文件进行解压,共31个csv表格,解压后共30多GB,我的eICU数据集存放的地址:H:\eICU\eICUdata

greeplum 修改分区 grep rescue_postgresql_03


接着需要下载SQL文件来对数据集进行安装

地址:https://github.com/mit-lcp/eicu-code

在build-db的postgre文件夹下找到这四个文件,新建一个文件夹将它们放进去

E:\eicu_load_sql

greeplum 修改分区 grep rescue_postgresql_04


greeplum 修改分区 grep rescue_postgresql_05

步骤三

正式安装,前提:postgresql已经安装且配置好:

各文件地址说明:
①4个sql文件:E:\eicu_load_sql
②解压后的eICU数据文件:H:\eICU\eICUdata

  1. 进入postgre的shell,在输入用户口令前几个步骤都可以直接回车跳过
  2. 依次输入
DROP DATABASE IF EXISTS eicu;
CREATE DATABASE EICU OWNER postgres;

建立一个eICU数据库空库,用户为postgre

\c eicu;

连接到eICU数据库

CREATE SCHEMA eicuii;

创建模式

set search_path to eicuii;

设置搜索路径到eicuii

\i E:/eicu_load_sql/postgres_create_tables.sql;

创建数据库中的表

\i E:/eicu_load_sql/postgres_load_data.sql;

导入数据

greeplum 修改分区 grep rescue_postgresql_06


\i E:/eicu_load_sql/postgres_add_indexes.sql;

建立索引

greeplum 修改分区 grep rescue_sql_07


\i E:/eicu_load_sql/postgres_checks.sql;

检查数据库内容是否安装正确,全都PASSED则表示全都安装正确

greeplum 修改分区 grep rescue_postgresql_08


如果你的Navicat连接了postgre,那么在Navicat里便可以看到eICU的这些表

greeplum 修改分区 grep rescue_greeplum 修改分区_09