Skip to content

pladata-encore/DE33-2st-ECommerce

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

23 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

E-Commerce 데이터 분석 및 시각화

🌱 팀원

😎오현옥     🐬유미라     🦄진현석     🎸최동현     

👨‍🏫 프로젝트 개요

  • Kaggle의 CRM 데이터를 바탕으로 BG/NRD 모델을 사용하여 고객 구매 횟수를 예측하고, Streamlit을 통해 시각화 진행
  • 완성된 애플리케이션은 Docker 이미지로 빌드

🔨 기술 스택

개발환경

DB

🔧 시스템 아키텍처

ERD

🖥️수행결과

  • 데이터 전처리를 거쳐 RFM 분석을 수행하여 각 고객에게 점수를 부여하고, 이를 기반으로 고객 세그먼트를 분류
  • BN/NBD 모델을 활용하여 고객의 rfm 데이터를 기반으로 가장 많은 거래가 예상되는 고객을 식별

데이터 전처리

  • 이상치 및 결측치 처리
    • 주문 취소 데이터 제거 : InvoiceNo에 "C"가 포함된 행(취소된 주문)을 필터링하여 제거
    • 유효한 주문 필터링 : Quantity가 0이 아닌 주문만 남김
    • 상하위 극단값 정제
  • 총 판매 금액 생성 : Quantity와 UnitPrice를 곱하여 TotalPrice 열 추가

BG/NRD 모델

  • 고객의 미래 구매 행동을 예측하기 위한 확률 모델로 고객의 구매 횟수와 구매 중단 가능성을 추정하여 고객 생애 가치(LTV, LifeTime Value)를 계산하는 데 활용
  • 위 프로젝트에서는 예측 구매 횟수 시각화 진행

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •