Classes para ajudar no desenvolvimento e análise de data science que criei ao longo da minha jornada em ciência de dados
Essas classes são apenas um esboço inicial que será aprimorado ao longo do tempo. Minha intenção é construir uma biblioteca que possa ser usada por outros desenvolvedores e cientistas de dados.
- 🐍Python
- 🐼Pandas
- 📝Numpy
- 📈Matplotlib
- 📉Seaborn
- 🪐Jupyter Notebook
- 🖼Drawio
-
📈 Classe de gráficos com seaborn and matplotlib
- Plotting multiple graphs in one figure with title, subtitle, legend, etc.
- Most functions are available, but need to be organized and machined as a class
- Figure out how to make it more flexible with different quantities of graphs in one figure. Probably with gridspec.
- They also need to be generalized to handle datasets in various plot cases like bar charts, scatter plots, line charts, etc.
-
📝 Classe de descrição geral de análise de dados
- Generate tables like data types, missing values, statistics info about dataset, etc.
- Most functions are available, but need to be organized and machined as a class
- Easier to be generalized, since we'll just use default pandas functions
Antes de começar, verifique se você atende aos seguintes requisitos:
- Você instalou a versão mais recente do Python, pandas, numpy, matplotlib, seaborn e Jupyter Notebook.
- No mínimo Python 3.6 é necessário
Para instalar a Data Science Classes, siga os passos:
- 📁 Selecione uma pasta na qual você deseja que seu projeto fique
...
📁 Data Science ⬅️ 💻 Inicie o seu terminal aqui 💻
📁 Diamond_Analysis
📁 Python_Studies
📁 Iris_Analysis
...
- 💻 Instale o pandas, numpy, matplotlib, seaborn, e Jupyter Notebook com pip:
pip install pandas numpy matplotlib seaborn jupyter
- 💻 Por enquanto nenhuma das classes é instalável diretamente, mas você pode baixá-las clonando este repositório:
git clone https://github.com/AndrewLaganaro/Data_Science_Classes
...
📁 Data Science
📁 Diamond_Analysis
📁 Python_Studies
📁 Iris_Analysis
📁 Data Science Classes
...
Para usar estas classes dê uma olhada nas descrições delas abaixo.
-
📊 Dataset loader
- Destinada a carregar arquivos para auxiliar e agilizar o carregamento de dados em uma determinada análise.
- Serve para importar modelos, scalers, encoders e arquivos binários em geral usados em machine learning
-
Substituir a nomenclatura direta da pasta por um nome de grupo de diretórios, especificado dentro do arquivo .json
- Em vez de 'nome da pasta', especificar 'nome do grupo de pastas' que pode conter várias pastas dentro
-
Separar a função de validação da classe principal e mover para um arquivo separado
- Melhorar a legibilidade do funcionamento da classe principal.
- Suporte a arquivos parquet
- Suporte a arquivos csv
- Suporte a arquivos txt
- Suporte a arquivos hdf5
- Suporte a arquivos pickle
- Suporte a arquivos json