En utilisant les donnée venant de 2023 2024 Salary Guide_PDF.pdf de randstak, nous allons créer un modèle de prédiction de salaire pour les différents métiers en fonction de la région, de l'expérience et du niveau d'étude.
-
Use the package manager pip to install the requirements.
pip install -r requirements.txt
-
run pdf salary scraper
python src/pdf.py python src/pdf_salary_scraper.py python stackoverflow_scraper.py
-
run jupyter notebook
jupyter notebook
Cette structure s’inspire de Cookie Cutter Data Science
La qualité du code de science des données est une question d'exactitude et de reproductibilité.
├── .devcontainer <- Fichiers de configuration pour VSCode
├── .github <- Fichiers de configuration pour Github
├── README.md <- The top-level README for developers using this project.
├── data <- Données utilisées pour le projet
│ ├── pdf <- Données venant du pdf
│ ├── pickle <- Données venant du pdf transformées en pickle
|
├── docs <- Documentation du projet et de la stratégie
│ ├── notebooks <- Jupyter notebooks
│ ├── reports <- Generated analysis as HTML, PDF, LaTeX, etc.
│
├── sandbox
│ ├── __init__.py <- Makes src a Python module
│ ├── output <- Output pdf de ta stratégie
│ ├── salary_exploration.ipynb <- Jupyter de ta stratégie
│
├── src <- Source code for use in this project.
│ ├── __init__.py <- Makes src a Python module and les fonctions sont accessibles depuis n'importe quel fichier
│ ├── analyse.py <- Fichier contenant les fonctions liées à l'analyse
│ ├── config.py <- Fichier contenant les fonctions liées à la configuration
│ ├── pdf_salary_scraper.py <- Fichier contenant les fonctions liées à la collecte des données pour le pdf
│ ├── pdf.py <- Fichier contenant les fonctions liées à la collecte des données pour le pdf
│ ├── stackoverflow_scraper.py <- Fichier contenant les fonctions liées à la collecte des données pour stackoverflow
│ ├── test.py <- Fichier contenant les fonctions liées aux tests
│ ├── utils.py <- Fichier contenant les fonctions liées aux utils
├── web <- Web du projet
├── wiki <- Wiki du projet
│
├── .pre-commit-config.yaml <- Configuration de pre-commit
├── pyproject.toml <- Configuration de poetry
├── requirements.txt <- The requirements file for reproducing the analysis environment, e.g. generated with `pip freeze > requirements.txt`
├── sample.env <- Fichier d'exemple pour le fichier .env