Skip to content

Latest commit

 

History

History
158 lines (111 loc) · 6.23 KB

File metadata and controls

158 lines (111 loc) · 6.23 KB

LymphNodeMetastases_of_BreastCancer

Lymph Node Metastases of Breast Cancer



프로젝트 주제

  • 유방암 병리 슬라이드 영상과 임상 항목을 통한 유방암의 임파선 전이 여부 이진 분류 예측

프로젝트 내용

  • Tabular data, Image Data에서 각각 특징을 추출하고 합쳐, 하나의 딥러닝 모델으로 사용하여 이진분류

데이터

개발환경

  • Apple Silicon MacMini CTO, MacBook Pro
  • Python 3.8, Pytorch, OpenCV, Sklearn, Pandas, Etc..
  • Efficientnet_b0 pretrained

프로젝트 기대효과

  • 임파선은 암의 전이에 치명적인 역할을 하므로, 림프절 전이 여부에 따라 치료와 예후가 크게 좌우된다.
  • 따라서 림프절 전이 여부와 전이 단계를 파악하는 것이 암의 치료와 진단에 매우 중요하므로 이에 기여한다.

팀 구성

이름 역할 담당업무 공동업무
권진욱 팀장 Image Processing / EDA Modeling
류제욱 팀원 Tabular Data Feature Extraction
전대광 팀원 Tabular Data EDA / Wrangling
송일수 팀원 Reference / paper searching




데이터 설명

데이터는 위 URL에서 다운로드 받아야 합니다.


1. Image Data

유방암 환자의 병리 슬라이드 이미지
Image Max Height 8299 / Image max Width 3991
(유방암 환자의 조직을 염색하여 동결절편한 것의 이미지입니다.)

  • p_images

Image에 Padding을 적용하여 고정 Size로 설정한 Image 입니다.

  • 1024_folder

Image의 가로/세로 크기 중 큰 값을 가지고 비율로 설정하여 Max 1024에 맞추어 Resize 한 Image 입니다.
이미지 손실을 줄이기 위하여 INTER_AREA, INTER_LANCZOS4 두가지의 보간법을 사용하였습니다.

  • FULL_PADDING

Image의 Max Width, Height 값을 가지고 Padding한 데이터 입니다.


2. Tabuler Data

유방암 환자의 전이여부 검사 결과 항목과 환자 개인정보, 병리학 이미지 경로 등이 입력된 28개 column의 데이터

28 columns : ID, img_path, mask_path(Just train set), 나이, 수술연월일, 진단명, 암의위치, 암의개수, 암의장경, NG, HG, HG_score1, HG_score2, HG_score3, DCIS_or_LCIS 여부, DCIS_or_LCIS_type, T_category, ER, ER_Allred_score, PR, PR_Allred_score, KI-67_LI_percent, HER2, HER2_IHC, HER2_SISH, HER2_SISH_ratio, BRCA_mutation, N_category(Just train set)




Code File 설명

1. File Name "00_"

Mask Image를 확인

2. File Name "01_"

EDA

3. File Name "02_"

제거

4. File Name "03_"

Activation Function에 따른 Score를 확인

5. File Name "04_"

Model 구성 및 변경




Activate Function Validation Score

Activation Last Epoch Max Achieved Average
LeakyReLU [Baseline] 77.892 77.892 74.228
LeakyReLU (Reduced) 75.758 76.540 75.286
ELU 75.706 80.390 75.958
ELU (Added) 76.768 79.884 77.997
GELU 77.249 77.679 74.743
GELU (Reduced) 75.485 77.422 75.806
GELU (Added) 78.304 78.435 76.896
SELU (Added) 72.806 74.960 73.193




Reference

Multiple Instance Learning: Model Pipeline

Dual-stream Multiple Instance Learning Network for Whole Slide Image Classification with Self-supervised Contrastive Learning

Multiple Instance Learning

MedAI #36: Weakly supervised tumor detection in whole slide image analysis | Bin Li

2018 Data Science Bowl: Find the nuclei in divergent images to advance medical discovery

Breast Cancer Classification With PyTorch and Deep Learning

Deep learning-based cross-classifications reveal conserved spatial behaviors within tumor histological images

Deep Learning Models for Histopathological Classification of Gastric and Colonic Epithelial Tumours

Finetuning Torchvision Models

Torchvision.models

U-Net: Convolutional Networks for Biomedical Image Segmentation

U-Net For Brain MRI

Models and Pre-trained Weights

U-Net Model with submission

Breast Cancer Histology

BRCA Gene Mutations: Cancer Risk and Genetic Testing