Dette prosjektet viser hvordan man kan segmentere kunder basert pΓ₯ alder, inntekt og kjΓΈpsatferd ved hjelp av K-Means clustering.
Dataene kommer fra Mall Customers-datasettet (Kaggle).
- Databehandling og skalering (StandardScaler)
- Usupervisert læring (K-Means)
- Elbow-metoden for valg av antall klynger
- Visualisering av segmentene
- Eksport av segmenterte kunder til CSV
- Lagre K-Means-modellen for videre bruk
customer-segmentation/
ββ data/
β ββ Mall_Customers.csv
β
ββ models/
β ββ kmeans_model.joblib
β
ββ reports/
β ββ clustered_customers.csv
β
ββ src/
β ββ train_kmeans.py
β ββ utils.py
β
ββ notebooks/
β ββ kmeans_segmentation.ipynb
β
ββ requirements.txt
ββ README.md
python -m venv .venv
.\.venv\Scripts\Activate.ps1
pip install -r requirements.txt
python -m src.train_kmeans- Resultater lagres automatisk i /models og /reports
- Clustering
- Sentroidberegning
- Distansescore
- Visualisering av klustre
- Test DBSCAN eller Agglomerative Clustering
- Legg til PCA for visualisering i 2D
- Lag Streamlit-app for dynamisk klusteranalyse
- Data Analyst β Python | Power BI | Machine Learning