Ce projet a pour objectif d'analyser automatiquement le contenu d’un site web à partir d’une URL donnée, dans le cadre d'un exercice issu d’un cahier des charges de veille technologique ou d’analyse web.
Ce projet répond aux spécifications suivantes :
- Collecter les données textuelles d’un site web (balises HTML ciblées)
- Extraire certaines informations (titres, liens, métadonnées…)
- Nettoyer et afficher les données dans un format lisible (texte ou tableau)
👉 L’objectif est de proposer un outil simple d’extraction et d’analyse du contenu d’un site, dans un cadre pédagogique ou exploratoire.
- Python 3.10
- requests
- BeautifulSoup 4
- pandas
git clone https://github.com/steven91-ar/Python_analyse_site.git
cd Python_analyse_site
pip install -r requirements.txt