Skip to content

Инструмент на Python для разведочного анализа данных (EDA) и визуализации, поддерживающий загрузку данных CSV и JSON, с модульной архитектурой ООП. Практическая работа по теме: "Обнаружение и визуализация данных для понимания их сущности" дисциплины "МДК 13.01: Основы применения методов искусственного интеллекта в программировании".

License

Notifications You must be signed in to change notification settings

MindlessMuse666/eda-explorer

Repository files navigation

Исследование EDA (EDA Explorer) MIT-License image

Этот проект представляет собой инструмент на Python для разведочного анализа данных (EDA) и визуализации. Он разработан с целью предоставить модульное и расширяемое решение для исследования наборов данных, следуя принципам ООП. Этот проект является практической работой.

  • Тема практической работы: Обнаружение и визуализация данных для понимания их сущности
  • Дисциплина: МДК 13.01: Основы применения методов искусственного интеллекта в программировании

Возможности

  • Загрузка данных: Поддерживает загрузку данных как из CSV, так и из JSON файлов, как из локальных путей, так и по URL.
  • Анализ данных: Выполняет основные операции EDA, включая:
    • Проверку на наличие пропущенных значений.
    • Расчет описательных статистик для числовых данных.
    • Вычисление корреляционных матриц для понимания взаимосвязей между переменными.
  • Визуализация данных: Создает наглядные визуализации, такие как:
    • Гистограммы для отображения распределений отдельных переменных.
    • Тепловые карты для визуализации корреляционных матриц.
  • Модульность и расширяемость: Реализован с акцентом на модульность, используя принципы ООП для упрощения сопровождения и расширения.
  • Обработка ошибок: Включена надежная обработка ошибок для корректного управления различными сценариями, включая некорректные форматы файлов, отсутствующие данные и проблемы с сетью.

Скриншоты работы

image

Корреляционная матрица

image

График распределения чаевых

image

График распределения общей суммы счёта

image

Используемые технологии

  • Python
  • Pandas
  • Seaborn
  • Matplotlib
  • Requests

Структура проекта

Дерево проекта

eda-explorer/
├── abstractions/
│   └── abstract_data_loader.py
├── analysis/
│   ├── data_analyser.py
│   └── tips_data_analyzer.py
├── loaders/
│   ├── csv_data_loader.py
│   └── json_data_loader.py
├── visualization/
│   └── data_visualizer.py
├── __init__.py
├── .gitignore
├── LICENSE
├── main.py
├── README.md
└── requirements.txt

Главные скрипты проекта

  • init.py: Делает eda-explorer пакетом Python.
  • abstract_data_loader.py: Определяет абстрактный класс DataLoader и конкретные классы для загрузки данных (CSVDataLoader, JSONDataLoader).
  • data_analyzer.py: Определяет класс DataAnalyzer для выполнения операций EDA.
  • tips_data_analyzer.py: Определяет класс TipsDataAnalyzer для координации процесса анализа и визуализации данных, конкретно для данных о чаевых.
  • data_visualizer.py: Определяет класс DataVisualizer для создания визуализаций.
  • main.py: Основной скрипт для запуска анализа и визуализации.

Начало работы

  1. Склонируйте репозиторий:
git clone https://github.com/MindlessMuse666/eda-explorer
  1. Перейдите в директорию проекта:
cd eda-explorer
  1. Установите необходимые пакеты с помощью requirements.txt:
pip install -r requirements.txt
  1. Запустите основной скрипт:
python main.py

Вклад

Приветствуются любые вклады! Не стесняйтесь открывать issues или отправлять pull requests.

Лицензия

Этот проект распространяется под лицензией MIT - смотрите файл LICENSE для деталей.

Автор

Бедин Владислав (MindlessMuse666)

About

Инструмент на Python для разведочного анализа данных (EDA) и визуализации, поддерживающий загрузку данных CSV и JSON, с модульной архитектурой ООП. Практическая работа по теме: "Обнаружение и визуализация данных для понимания их сущности" дисциплины "МДК 13.01: Основы применения методов искусственного интеллекта в программировании".

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages