Skip to content

Classes to help with data science development and analysis that I came up with along my data science journey

License

Notifications You must be signed in to change notification settings

AndrewLaganaro/Data_Science_Classes

Repository files navigation

Classes_Data_Science


Data Science Classes

Readme in English

American

Léame en Español

Español

Portfolio

Autor: Andrew Laganaro

📜 Sobre o projeto

Classes para ajudar no desenvolvimento e análise de data science que criei ao longo da minha jornada em ciência de dados

Essas classes são apenas um esboço inicial que será aprimorado ao longo do tempo. Minha intenção é construir uma biblioteca que possa ser usada por outros desenvolvedores e cientistas de dados.

🚀 Construído com

  • 🐍Python
  • 🐼Pandas
  • 📝Numpy
  • 📈Matplotlib
  • 📉Seaborn
  • 🪐Jupyter Notebook
  • 🖼Drawio

🛠 Projetos

Store Sales Analysis

Data Science Framework

Data Science Classes

⬇️ Dá uma olhada no meu Portfolio ⬇️

Portfolio

🎯 Status geral do projeto

⭐️ Classes que serão adicionadas
  • 📈 Classe de gráficos com seaborn and matplotlib

    • Plotting multiple graphs in one figure with title, subtitle, legend, etc.
    • Most functions are available, but need to be organized and machined as a class
    • Figure out how to make it more flexible with different quantities of graphs in one figure. Probably with gridspec.
    • They also need to be generalized to handle datasets in various plot cases like bar charts, scatter plots, line charts, etc.
  • 📝 Classe de descrição geral de análise de dados

    • Generate tables like data types, missing values, statistics info about dataset, etc.
    • Most functions are available, but need to be organized and machined as a class
    • Easier to be generalized, since we'll just use default pandas functions

📝 Como usar este projeto

💻 Pré-requisitos

Antes de começar, verifique se você atende aos seguintes requisitos:

  • Você instalou a versão mais recente do Python, pandas, numpy, matplotlib, seaborn e Jupyter Notebook.
    • No mínimo Python 3.6 é necessário
🚀 Instalando a Data Science Classes

Para instalar a Data Science Classes, siga os passos:

  • 📁 Selecione uma pasta na qual você deseja que seu projeto fique
...
📁 Data Science ⬅️ 💻 Inicie o seu terminal aqui 💻
    📁 Diamond_Analysis
    📁 Python_Studies
    📁 Iris_Analysis
    ...
  • 💻 Instale o pandas, numpy, matplotlib, seaborn, e Jupyter Notebook com pip:
pip install pandas numpy matplotlib seaborn jupyter
  • 💻 Por enquanto nenhuma das classes é instalável diretamente, mas você pode baixá-las clonando este repositório:
git clone https://github.com/AndrewLaganaro/Data_Science_Classes
...
📁 Data Science
    📁 Diamond_Analysis
    📁 Python_Studies
    📁 Iris_Analysis
    📁 Data Science Classes
    ...

☕ Usando a Data Science Classes

Para usar estas classes dê uma olhada nas descrições delas abaixo.

📚 Atualmente as seguintes classes estão disponíveis:
  • 📊 Dataset loader

    • Destinada a carregar arquivos para auxiliar e agilizar o carregamento de dados em uma determinada análise.
    • Serve para importar modelos, scalers, encoders e arquivos binários em geral usados em machine learning

🎯 Status geral do projeto

⭐️ Recursos a serem finalizados

  • Substituir a nomenclatura direta da pasta por um nome de grupo de diretórios, especificado dentro do arquivo .json

    • Em vez de 'nome da pasta', especificar 'nome do grupo de pastas' que pode conter várias pastas dentro
  • Separar a função de validação da classe principal e mover para um arquivo separado

    • Melhorar a legibilidade do funcionamento da classe principal.

⭐️ Recursos a serem adicionados

  • Suporte a arquivos parquet
  • Suporte a arquivos csv
  • Suporte a arquivos txt
  • Suporte a arquivos hdf5
  • Suporte a arquivos pickle
  • Suporte a arquivos json

⬇️ Dá uma olhada no meu Portfolio ⬇️

Portfolio

About

Classes to help with data science development and analysis that I came up with along my data science journey

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published