Skip to content

3rd year student at Lomonosov Moscow State University. Practice at the Department of Data Quality Control and Communications Development of the Bureau of National Statistics of the Agency for Strategic Planning and Reforms of the Republic of Kazakhstan.

Notifications You must be signed in to change notification settings

BorDch/BNS_3_course_practice

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

📂 Проект: Автоматизация сортировки и визуализации данных

📜 Описание

Репозиторий содержит два основных модуля:

  1. task1_visualization — визуализация данных по ЭПХУ в интерактивных HTML и Jupyter Notebook.
  2. ephu_final — готовое приложение для автоматической сортировки Excel-файлов по КАТО-идентификатору с подробным руководством пользователя.

📁 Структура репозитория

BNS_3_course_practice/
|
├── task1_visualization/
│ ├── gdb_fl_f.html # Визуализация данных (женщины) — интерактивный график
│ ├── gdb_fl_f.ipynb # Код построения графика (женщины)
│ ├── gdb_fl_m.html # Визуализация данных (мужчины)
│ ├── gdb_fl_m.ipynb # Код построения графика (мужчины)

├── ephu_final/
│ ├── ephu.ipynb # Тестирование работы приложения
│ ├── kato_sorter.py # Класс для сортировки файлов по КАТО
│ ├── main.py # Скрипт запуска проекта
│ ├── requirements.txt # Список зависимостей
│ ├── руководство_ЭПХУ.pdf # Руководство пользователя

🚀 Запуск приложения

  1. Установить Python версии 3.10+.
  2. Клонировать репозиторий:
    https://github.com/BorDch/BNS_3_course_practice.git
    cd BNS_3_course_practice/ephu_final
  3. Установить зависимости:
pip install -r requirements.txt
  1. Подготовить данные:
    • В корневую папку проекта поместить директории с Excel-файлами приложений.
  2. Запустить проект:
python main.py
  1. После выполнения (~10–15 минут) будет создана итоговая папка, содержащая собранные и отсортированные файлы по регионам.

📊 Визуализация

В папке task1_visualization находятся:

  • .ipynb — ноутбуки с кодом для построения графиков.

  • .html — готовые интерактивные визуализации, которые можно открыть в браузере.

📖 Руководство

Подробное руководство по использованию приложения находится в файле:

  • ephu_final/руководство_ЭПХУ.pdf

🖥 Пример кода запуска

from kato_sorter import KATOFileSorter

if __name__ == "__main__":
    sorter = KATOFileSorter(input_dir='.')
    sorter.delete_kato_subfolders()
    sorter.process_files()
    sorter.save_kato_files()

📌 Контакты / GitHub

About

3rd year student at Lomonosov Moscow State University. Practice at the Department of Data Quality Control and Communications Development of the Bureau of National Statistics of the Agency for Strategic Planning and Reforms of the Republic of Kazakhstan.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published