Skip to content

Fix: AWS Sagemaker에서 이진 분류 모델 생성 불가 문제 #5

@JustinLee02

Description

@JustinLee02
  • 문제상황
    • AWS Sagemaker에서 모델을 생성할 때, 2진 분류(Binary Classification) 옵션을 선택할 수 없는 문제가 발생함
  • 원인
    • Transfer(이적) 여부를 나타내는 라벨이 극단적으로 불균형이거나 데이터가 부족해, Sagemaker에서 2진 분류로 인식하지 못하는 것으로 추정
    • 2022년 기준 데이터만 사용했을 때, 이적 라벨(1)과 미이적 라벨(0) 간 비율이 크게 불균형했을 가능성
  • 해결방안
  1. 데이터 스키마 재구성 (라벨(Transfer_Label)을 포함해, 아래와 같은 필드들을 충분히 수집/정리해 Sagemaker가 분류 문제임을 명확히 인식하도록 함)
필드명 데이터 타입 설명
Season String 또는 Integer 해당 시즌 (예: “2020/21” 또는 “2020”) – 기준 시점을 명확히 하기 위함
Player_Name String 선수 이름
Date_of_Birth Date 선수 생년월일 (예: “1995-03-13”)
Age Integer 또는 Float 시즌 시작일 기준 선수 나이 (또는 계산 후 나이)
Position String 선수 포지션 (예: FW, MF, DF, GK)
Team_Name String 해당 시즌의 소속 팀 (예: “FC Seoul”)
Appearances Integer 시즌 동안 출전 경기 수
Goals Integer 시즌 동안 득점 수
Assists Integer 시즌 동안 어시스트 수
Minutes_Played Integer 총 출전 시간(분)
Market_Value Numeric 또는 String 시즌 말 또는 시작 시점의 시장 가치 (필요시, 화폐 기호 제거 후 수치화)
Contract_Start_Date Date 현재 계약 시작일
Contract_End_Date Date 현재 계약 종료일
Contract_Remaining Integer 시즌 종료 시점 기준 남은 계약 기간 (년 또는 개월 단위, 계산된 값)
Team_Rank Integer 해당 시즌 팀 순위
Transfer_Label Integer 라벨: 해당 시즌 종료 후, 다음 시즌에 팀이 변경되었으면 1 (이적), 그대로면 0 (미이적)
Additional_Features JSON 또는 추가 열들 (선택사항) 부상 기록, 에이전트, 연봉, 언론 루머, 경기 평점 등

! 유료 api 사용 고려

Metadata

Metadata

Assignees

Labels

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions