Skip to content

Latest commit

 

History

History
69 lines (51 loc) · 3.06 KB

File metadata and controls

69 lines (51 loc) · 3.06 KB

Final Project: Data Mining 📊

Project 1: Supervised Analysis of Walmart Sales Trends 🛒

Overview

Proyek ini bertujuan untuk menganalisis tren penjualan Walmart menggunakan pendekatan terawasi. Metodologi yang digunakan adalah CRISP-DM, yang terdiri dari beberapa tahap berikut:

  1. Business Understanding: Memahami tujuan dan objektif bisnis terkait tren penjualan Walmart.
  2. Data Understanding: Mendapatkan pemahaman awal tentang dataset penjualan Walmart.

Data Preparation 🛠️

  • Cleaning: Membersihkan dataset untuk memastikan keakuratan dan konsistensi.
  • Transformation & Extraction: Mengubah dan mengekstraksi fitur yang relevan dari dataset.
  • Reduction: Mengurangi dimensionalitas dataset jika diperlukan.
  • Slicing: Memotong dataset untuk fokus pada aspek tertentu.
  • Formatting:
    • Encoding: Mengkodekan variabel kategorikal.
    • Splitting: Memisahkan dataset untuk tujuan pelatihan dan pengujian.
    • Cross Validation: Mengimplementasikan teknik validasi silang.

Modelling 🤖

  • Preprocessing: Memproses dataset sebelum pemodelan.
  • Modelling:
    • Gaussian Naive Bayes (GNB)
    • K-Nearest Neighbors (KNN)
    • C4.5 Decision Tree

Evaluation 📝

Menilai kinerja model yang telah dibuat.

Deployment 🚀

Mengimplementasikan model yang telah dilatih untuk penggunaan praktis.

Detailed Report 📄

Project 2: Unsupervised Analysis of Socio-Economic Factors Across Countries

Overview

Proyek ini berfokus pada analisis unsupervised menggunakan metodologi CRISP-DM untuk menganalisis faktor sosial-ekonomi antar negara.

  1. Business Understanding 🌐: Memahami faktor sosial-ekonomi yang mempengaruhi kesejahteraan negara.
  2. Data Understanding 📊: Mengumpulkan dan menggambarkan dataset sosial-ekonomi.

Data Exploration 🔍

  • Handling Outliers: Mengatasi outlier dalam dataset.

Data Preparation 🛠️

  • Missing Value Check: Memeriksa nilai kosong dalam dataset.
  • Bivariate Analysis: Menganalisis hubungan antara pasangan variabel.

Evaluation 📝

Menilai langkah-langkah pra pemrosesan.

Modelling 🤖

  • Pemodelan: Melakukan pemodelan unsupervised untuk mengidentifikasi pola dan faktor kunci yang mempengaruhi kesejahteraan negara.

Evaluation 📝

Menilai kinerja model.

Deployment 🚀

Mengimplementasikan wawasan yang diperoleh dari analisis.

Detailed Report 📄