-
Notifications
You must be signed in to change notification settings - Fork 1
Open
Labels
Description
- 문제상황
- AWS Sagemaker에서 모델을 생성할 때, 2진 분류(Binary Classification) 옵션을 선택할 수 없는 문제가 발생함
- 원인
- Transfer(이적) 여부를 나타내는 라벨이 극단적으로 불균형이거나 데이터가 부족해, Sagemaker에서 2진 분류로 인식하지 못하는 것으로 추정
- 2022년 기준 데이터만 사용했을 때, 이적 라벨(1)과 미이적 라벨(0) 간 비율이 크게 불균형했을 가능성
- 해결방안
- 데이터 스키마 재구성 (라벨(Transfer_Label)을 포함해, 아래와 같은 필드들을 충분히 수집/정리해 Sagemaker가 분류 문제임을 명확히 인식하도록 함)
| 필드명 | 데이터 타입 | 설명 |
|---|---|---|
| Season | String 또는 Integer | 해당 시즌 (예: “2020/21” 또는 “2020”) – 기준 시점을 명확히 하기 위함 |
| Player_Name | String | 선수 이름 |
| Date_of_Birth | Date | 선수 생년월일 (예: “1995-03-13”) |
| Age | Integer 또는 Float | 시즌 시작일 기준 선수 나이 (또는 계산 후 나이) |
| Position | String | 선수 포지션 (예: FW, MF, DF, GK) |
| Team_Name | String | 해당 시즌의 소속 팀 (예: “FC Seoul”) |
| Appearances | Integer | 시즌 동안 출전 경기 수 |
| Goals | Integer | 시즌 동안 득점 수 |
| Assists | Integer | 시즌 동안 어시스트 수 |
| Minutes_Played | Integer | 총 출전 시간(분) |
| Market_Value | Numeric 또는 String | 시즌 말 또는 시작 시점의 시장 가치 (필요시, 화폐 기호 제거 후 수치화) |
| Contract_Start_Date | Date | 현재 계약 시작일 |
| Contract_End_Date | Date | 현재 계약 종료일 |
| Contract_Remaining | Integer | 시즌 종료 시점 기준 남은 계약 기간 (년 또는 개월 단위, 계산된 값) |
| Team_Rank | Integer | 해당 시즌 팀 순위 |
| Transfer_Label | Integer | 라벨: 해당 시즌 종료 후, 다음 시즌에 팀이 변경되었으면 1 (이적), 그대로면 0 (미이적) |
| Additional_Features | JSON 또는 추가 열들 | (선택사항) 부상 기록, 에이전트, 연봉, 언론 루머, 경기 평점 등 |
! 유료 api 사용 고려
Reactions are currently unavailable