Proyek ini bertujuan untuk menganalisis tren penjualan Walmart menggunakan pendekatan terawasi. Metodologi yang digunakan adalah CRISP-DM, yang terdiri dari beberapa tahap berikut:
- Business Understanding: Memahami tujuan dan objektif bisnis terkait tren penjualan Walmart.
- Data Understanding: Mendapatkan pemahaman awal tentang dataset penjualan Walmart.
- Cleaning: Membersihkan dataset untuk memastikan keakuratan dan konsistensi.
- Transformation & Extraction: Mengubah dan mengekstraksi fitur yang relevan dari dataset.
- Reduction: Mengurangi dimensionalitas dataset jika diperlukan.
- Slicing: Memotong dataset untuk fokus pada aspek tertentu.
- Formatting:
- Encoding: Mengkodekan variabel kategorikal.
- Splitting: Memisahkan dataset untuk tujuan pelatihan dan pengujian.
- Cross Validation: Mengimplementasikan teknik validasi silang.
- Preprocessing: Memproses dataset sebelum pemodelan.
- Modelling:
- Gaussian Naive Bayes (GNB)
- K-Nearest Neighbors (KNN)
- C4.5 Decision Tree
Menilai kinerja model yang telah dibuat.
Mengimplementasikan model yang telah dilatih untuk penggunaan praktis.
Proyek ini berfokus pada analisis unsupervised menggunakan metodologi CRISP-DM untuk menganalisis faktor sosial-ekonomi antar negara.
- Business Understanding 🌐: Memahami faktor sosial-ekonomi yang mempengaruhi kesejahteraan negara.
- Data Understanding 📊: Mengumpulkan dan menggambarkan dataset sosial-ekonomi.
- Handling Outliers: Mengatasi outlier dalam dataset.
- Missing Value Check: Memeriksa nilai kosong dalam dataset.
- Bivariate Analysis: Menganalisis hubungan antara pasangan variabel.
Menilai langkah-langkah pra pemrosesan.
- Pemodelan: Melakukan pemodelan unsupervised untuk mengidentifikasi pola dan faktor kunci yang mempengaruhi kesejahteraan negara.
Menilai kinerja model.
Mengimplementasikan wawasan yang diperoleh dari analisis.