Skip to content

Francois-lenne/Big-data-SIAD

Repository files navigation

Présentation du projet

Contexte

Dans le cadre de notre projet Big data du master SIAD, nous participons à la compétition Kaggle Tweet Disaster. Notre objectif est de définir si un tweet concerne réellement un événement ou non. Pour ce faire, nous avons utilisé les méthodes lié au domaine du NLP (Natural Language Process). Pour retraiter les tweet (lématisations ...). Puis la création de variable avec les mots les plus utilisés. Nous avons aussi utilisé des package comme Geotext qui utilise des modèles de machine learning pour définir si le lieux est une ville, pays ... Ces packages nous permettront ainsi d'enrichir notre jeu de donnée.

Notre projet est compsé de 4 membres :

Le projet est encadré par deux enseignant chercheur de l'université de Lille :

Stack technique du projet 💻

My Skills

Installation

Pour utiliser ce projet, vous devez avoir Python 3 installé sur votre ordinateur. Vous pouvez télécharger Python 3 à partir du site web officiel de Python.


Clonez ce dépôt de code à l'aide de la commande git clone https://github.com/Francois-lenne/Big-data-SIAD.git dans votre terminal.

git clone https://github.com/Francois-lenne/Big-data-SIAD.git

Allez dans le répertoire (le chemin peut varier selon vos répertoires) du projet à l'aide de la commande :

cd ~/GitHub/Big-data-SIAD/api

Installez les dépendances python en utilisant la commande :

pip install -r requirements.txt


Utilisation

Une fois que vous avez installé les dépendances, vous pouvez utiliser ce projet Python en suivant les instructions suivantes :


Ouvrez votre terminal et accédez au répertoire du projet (le chemin peut varier selon vos répertoires).

cd ~/GitHub/Big-data-SIAD/api

Lancez l'entraînement du modèle avec la commande :

python prepare.py

Exécutez la commande suivante :

uvicorn --reload main:app

L'application est lancé, vous pouvez ouvrir dans un navigateur web le fichier app.html et soumettre vos tweets.


Contributeurs

Développements réalisés par Ronan

  • 👨‍💻 Développements du front-end du site web
  • 🧑‍✈️ Gestion de projet (trello, répartition des tâches)
  • 📑 Rédaction du rapport
  • 📈 Modélisations

Développements réalisés par Yoann

  • 👨‍💻 Développements du back end du site web
  • 📑 Rédaction du rapport
  • 📈 Modélisations
  • 🌐 Déploiements du site web

Développements réalisés par François

  • 👷 Feature engineering
  • 📑 Rédaction du rapport
  • 📈 Modélisations
  • 🌐 Déploiements du site web

Développements réalisés par Louis

  • 👷 Feature engineering
  • 📑 Rédaction du rapport
  • 📈 Modélisations
  • 🚧 Test de plusieurs modélisations

Package utilisé pour réaliser les retraitements et le modèle

Licence

Ce projet est sous licence MIT. Consultez le fichier LICENSE.txt pour plus d'informations.

About

Participation à la compétition kaggle tweet disaster

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •