이상신호 감지 기반 비정상 작동 진단 경진대회 레파지토리입니다.
- 최종 리더보드: 상위 10% 46th으로 마무리되었습니다. 감사합니다
최고 성능 모델은 멀티클래스 이상탐지(21개 클래스) 문제를 해결하기 위해 설계된
H2O AutoML 기반 분할정복(Class-specific Reclassification) 파이프라인입니다.
클래스 간 경계가 불명확한 구간(특히 0, 3, 9, 15)을 별도로 분리해 정밀하게 재분류하는 구조를 가져요
-
주요 수치형 피처(
X_40,X_46,X_08,X_11,X_37) 중심으로 상호작용 피처 생성- 곱셈(
_mul_) - 양방향 나눗셈(
_div_)
- 곱셈(
-
규칙 기반 이진 피처 추가 (Rule-based Features)
- 특정 센서 값을 기준으로 명시적인 구간 분리
- 총 10개의 센서에 대해 추가 피처 생성
- 모든 클래스(0~20)를 대상으로 한 기본 AutoML 학습
- 모델 탐색 제한 시간:
max_runtime_secs = 6000 - 여러 알고리즘을 자동 탐색 및 앙상블 구성
- 1단계에서 오분류가 빈번한
0, 3, 9, 15만 따로 학습 - 동일한 AutoML 파이프라인 적용
- 주요 목적: 클래스 간 미세한 경계 구분 강화
- 전체 예측 수행 (1단계 모델)
- focus 클래스(
0, 3, 9, 15) 확률 합 계산 - 확률이
p_gate ≥ 0.5이상인 샘플만 2단계 모델로 재분류 - 나머지는 1단계 예측값 그대로 사용
📦 Data Input
├─ train.csv / test.csv
│
├── 🔧 Feature Engineering
│ ├─ Interaction (X_40·X_46, ratio features)
│ └─ Rule-based binary features
│
├── ⚙️ Stage 1: Global AutoML
│ └─ Classify all 0–20 classes
│
├── 🎯 Stage 2: Focus AutoML
│ └─ Re-classify [0,3,9,15] only
│
├── 🧮 Probability Routing
│ └─ p_focus ≥ 0.5 → send to stage 2
│
└── 📤 Output
└─ submission.csv