Lymph Node Metastases of Breast Cancer
- 유방암 병리 슬라이드 영상과 임상 항목을 통한 유방암의 임파선 전이 여부 이진 분류 예측
- Tabular data, Image Data에서 각각 특징을 추출하고 합쳐, 하나의 딥러닝 모델으로 사용하여 이진분류
- https://dacon.io/competitions/official/236011/data
데이터의 모든 권한은 데이콘에 있습니다. (DataSet Is Copyright DACON Inc. All rights reserved)
- Apple Silicon MacMini CTO, MacBook Pro
- Python 3.8, Pytorch, OpenCV, Sklearn, Pandas, Etc..
- Efficientnet_b0 pretrained
- 임파선은 암의 전이에 치명적인 역할을 하므로, 림프절 전이 여부에 따라 치료와 예후가 크게 좌우된다.
- 따라서 림프절 전이 여부와 전이 단계를 파악하는 것이 암의 치료와 진단에 매우 중요하므로 이에 기여한다.
이름 | 역할 | 담당업무 | 공동업무 |
---|---|---|---|
권진욱 | 팀장 | Image Processing / EDA | Modeling |
류제욱 | 팀원 | Tabular Data Feature Extraction | |
전대광 | 팀원 | Tabular Data EDA / Wrangling | |
송일수 | 팀원 | Reference / paper searching |
데이터는 위 URL에서 다운로드 받아야 합니다.
유방암 환자의 병리 슬라이드 이미지
Image Max Height 8299 / Image max Width 3991
(유방암 환자의 조직을 염색하여 동결절편한 것의 이미지입니다.)
- p_images
Image에 Padding을 적용하여 고정 Size로 설정한 Image 입니다.
- 1024_folder
Image의 가로/세로 크기 중 큰 값을 가지고 비율로 설정하여 Max 1024에 맞추어 Resize 한 Image 입니다.
이미지 손실을 줄이기 위하여 INTER_AREA, INTER_LANCZOS4 두가지의 보간법을 사용하였습니다.
- FULL_PADDING
Image의 Max Width, Height 값을 가지고 Padding한 데이터 입니다.
유방암 환자의 전이여부 검사 결과 항목과 환자 개인정보, 병리학 이미지 경로 등이 입력된 28개 column의 데이터
28 columns : ID, img_path, mask_path(Just train set), 나이, 수술연월일, 진단명, 암의위치, 암의개수, 암의장경, NG, HG, HG_score1, HG_score2, HG_score3, DCIS_or_LCIS 여부, DCIS_or_LCIS_type, T_category, ER, ER_Allred_score, PR, PR_Allred_score, KI-67_LI_percent, HER2, HER2_IHC, HER2_SISH, HER2_SISH_ratio, BRCA_mutation, N_category(Just train set)
1. File Name "00_"
Mask Image를 확인
2. File Name "01_"
EDA
3. File Name "02_"
제거
4. File Name "03_"
Activation Function에 따른 Score를 확인
5. File Name "04_"
Model 구성 및 변경
Activation | Last Epoch | Max Achieved | Average |
---|---|---|---|
LeakyReLU [Baseline] | 77.892 | 77.892 | 74.228 |
LeakyReLU (Reduced) | 75.758 | 76.540 | 75.286 |
ELU | 75.706 | 80.390 | 75.958 |
ELU (Added) | 76.768 | 79.884 | 77.997 |
GELU | 77.249 | 77.679 | 74.743 |
GELU (Reduced) | 75.485 | 77.422 | 75.806 |
GELU (Added) | 78.304 | 78.435 | 76.896 |
SELU (Added) | 72.806 | 74.960 | 73.193 |
Reference
Multiple Instance Learning: Model Pipeline
MedAI #36: Weakly supervised tumor detection in whole slide image analysis | Bin Li
2018 Data Science Bowl: Find the nuclei in divergent images to advance medical discovery
Breast Cancer Classification With PyTorch and Deep Learning
Deep Learning Models for Histopathological Classification of Gastric and Colonic Epithelial Tumours
U-Net: Convolutional Networks for Biomedical Image Segmentation