Autorzy: Izabela Skowron i Szymon Florek
Niniejsze repozytorium zawiera materiały i rozwiązania z laboratoriów realizowanych w ramach przedmiotu Metody Eksploracji Danych. Celem zajęć jest zapoznanie się z różnorodnymi technikami analizy danych, w tym:
- Regresja liniowa: modelowanie zależności między zmiennymi ciągłymi.
- Regresja logistyczna: analiza zależności między zmiennymi, gdzie zmienna zależna jest dychotomiczna.
- Klasyfikatory: implementacja i ocena różnych algorytmów klasyfikacyjnych, takich jak drzewa decyzyjne, k-NN, SVM i inne.
Repozytorium podzielone jest na katalogi odpowiadające poszczególnym laboratoriom:
MED_LAB_1/
- materiały z pierwszego laboratorium dotyczącego analizy regresji liniowej.MED_LAB_2/
- materiały z drugiego laboratorium poświęconego analizie regrejsi logistycznej (logit).MED_LAB_3/
- materiały z trzeciego laboratorium obejmującego analizę klasyfikatorow. Obecnie w produkcji
Aby zapewnić kompatybilność z Pythonem 3.12, zaleca się użycie następujących wersji pakietów:
- NumPy:
1.26.3
- pandas:
2.2.3
- Matplotlib:
3.7.1
- scikit-learn:
1.5.2
- statsmodels:
0.14.4
Aby zainstalować te pakiety, użyj następujących poleceń:
pip install numpy==1.26.3
pip install pandas==2.2.3
pip install matplotlib==3.7.1
pip install scikit-learn==1.5.2
pip install statsmodels==0.14.4
Pamiętaj, że niektóre z tych pakietów mogą wymagać dodatkowych zależności. Zaleca się instalację wirtualnego środowiska, aby uniknąć konfliktów z innymi projektami.
Jeśli napotkasz problemy z instalacją lub działaniem tych pakietów, sprawdź dokumentację każdego z nich pod kątem kompatybilności z Pythonem 3.12.
-
Sklonuj repozytorium:
git clone https://github.com/Floressek/MED.git
-
Przejdź do wybranego katalogu laboratorium:
cd MED/MED_LAB_X # Zamień X na numer laboratorium
-
Uruchom skrypt:
python main.py
Projekt jest licencjonowany na podstawie licencji MIT.