- Kaggle의 CRM 데이터를 바탕으로 BG/NRD 모델을 사용하여 고객 구매 횟수를 예측하고, Streamlit을 통해 시각화 진행
- 완성된 애플리케이션은 Docker 이미지로 빌드


- 데이터 전처리를 거쳐 RFM 분석을 수행하여 각 고객에게 점수를 부여하고, 이를 기반으로 고객 세그먼트를 분류
- BN/NBD 모델을 활용하여 고객의 rfm 데이터를 기반으로 가장 많은 거래가 예상되는 고객을 식별
- 이상치 및 결측치 처리
- 주문 취소 데이터 제거 : InvoiceNo에 "C"가 포함된 행(취소된 주문)을 필터링하여 제거
- 유효한 주문 필터링 : Quantity가 0이 아닌 주문만 남김
- 상하위 극단값 정제
- 총 판매 금액 생성 : Quantity와 UnitPrice를 곱하여 TotalPrice 열 추가
- 고객의 미래 구매 행동을 예측하기 위한 확률 모델로 고객의 구매 횟수와 구매 중단 가능성을 추정하여 고객 생애 가치(LTV, LifeTime Value)를 계산하는 데 활용
- 위 프로젝트에서는 예측 구매 횟수 시각화 진행