# clone repo
git clone https://github.com/MIT-LCP/mimic-code.git
cd mimic-code
# download data
wget -r -N -c -np --user <USERNAME> --ask-password https://physionet.org/files/mimiciv/2.0/
mv physionet.org/files/mimiciv mimiciv && rmdir physionet.org/files && rm physionet.org/robots.txt && rmdir physionet.org
createdb mimiciv
psql -d mimiciv -f mimic-iv/buildmimic/postgres/create.sql
psql -d mimiciv -v ON_ERROR_STOP=1 -v mimic_data_dir=mimiciv/2.0 -f mimic-iv/buildmimic/postgres/load_gz.sql
psql -d mimiciv -v ON_ERROR_STOP=1 -v mimic_data_dir=mimiciv/2.0 -f mimic-iv/buildmimic/postgres/constraint.sql
psql -d mimiciv -v ON_ERROR_STOP=1 -v mimic_data_dir=mimiciv/2.0 -f mimic-iv/buildmimic/postgres/index.sql
0. MIMIC-IV란?
MIMIC-IV (Medical Information Mart for Intensive Care IV)는 매사추세츠주 보스턴에 위치한 베스 이스라엘 디콘네스 메디컬 센터의 중환자실(ICU)에 입원한 환자들의 개인 식별 정보가 제거된 전자 건강 기록(EHR) 공개 데이터셋입니다. 2008년부터 2019년까지의 기간 동안 수집된 자료를 포함하며, MIMIC 데이터셋의 네 번째 버전입니다.
MIMIC-IV 데이터셋은 생체 신호, 검사 결과, 약물, 진단 및 수술 등 포괄적인 임상 자료뿐만 아니라 인구통계학적 정보, 입원 및 퇴원 세부 정보, 기타 임상 문서도 포함합니다. 이 데이터셋은 380,000명 이상의 고유 환자에 대한 2,800만 건 이상의 중환자실 입원 정보를 포함하고 있어, 세계에서 가장 큰 공개적으로 이용 가능한 중환자실 데이터셋 중 하나입니다.
MIMIC-IV 데이터셋은 47개 테이블과 7,000개가 넘는 변수로 구성된 관계형 데이터베이스 형식으로 구성되어 있습니다. 또한, 사망률, 패혈증, 재입원 등과 같은 유도 데이터셋도 포함되어 있으며, 이러한 데이터셋은 특정 연구 질문에 대한 사전 처리 데이터를 제공합니다. 또한 MIMIC-IV에는 개인 식별 정보가 제거된 자유 형식의 임상 노트도 포함되어 있습니다.
MIMIC-IV는 패혈증, 급성 신손상, 사망률 예측 및 자연어 처리 등 다양한 의료 연구 분야에서 사용되고 있습니다. 이러한 데이터셋의 이용 가능성은 임상 의사 결정 지원, 환자 분류 및 맞춤형 의학에 대한 새로운 알고리즘, 모델 및 방법을 개발하고 시험하는 데 필수적인 기반을 제공합니다.
MIMIC-IV 데이터셋에 대한 접근은 데이터 사용 계약서 작성 및 기관 검토 위원회(IRB) 승인을 받아야 합니다. 그러나 이 데이터셋은 전 세계 연구원들이 PhysioNet 저장소를 통해 무료로 접근할 수 있으며, 이 저장소는 데이터셋을 활용한 연구를 위한 튜토리얼, 코드 및 기타 자원을 제
1. 데이터 다운로드
physionet에서 MIMIC-IV 데이터 다운로드하기
2. DB에 데이터 저장하기
원하는 DB를 선택하여 MIMIC-IV 데이터를 저장할 수 있습니다.
DB가 PC에 설치되어 있어야 합니다.
PostgreSQL, mySQL, 구글 bigquery, duckdb, sqlite 중에서 선택 가능합니다.
저는 PostgreSQL 으로 진행하겠습니다.
github에서 mimic-code/mimic-iv/buildmimic/postgres/
에 들어가면 진행 가능.
참고자료
https://physionet.org/content/mimic-iv-demo/2.2/
https://github.com/MIT-LCP/mimic-code