Skip to content

Разработка программы по сбору и систематизации данных о более 850 тыс. кинофильмов с сайта Letterboxd.com. Анализ данных.

License

Notifications You must be signed in to change notification settings

GSimonX37/Letterboxd

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

letterboxd

Цель и задачи проекта

Цель проекта: провести анализ данных, размещенных на сайте letterboxd.com.

Задачи проекта:

  1. Собрать и систематизировать данные, размещенные на сайте letterboxd.com.
  2. Предварительно обработать и провести разведочный анализ данных.

Этапы проекта

Название этапа Описание этапа Инструменты
1 Сбор и систематизация данных Написание программы, осуществляющей сбор и систематизацию данных с сайта letterboxd.com. Сбор и систематизация данных.
  • AIOHTTP
  • BeautifulSoup4
2 Разведочный анализ данных Анализ основных свойств данных, выявление распределений, общих зависимостей и аномалий с помощью инструментов визуализации.
  • Jupyter
  • Matplotlib
  • NumPy
  • Pandas
  • Seaborn

Блокноты

  1. exploring.ipynb - предварительная обработка и проведение разведочного анализа данных.

Набор данных

Набор данных размещен на сайте kaggle.com, последнюю версию набора данных вы можете найти там.

Документация

  1. Начало работы.
  2. Структура проекта.
  3. Описание данных.
  4. Получение данных.

Лицензия

Распространяется по лицензии GNU General Public License v3.0. См. LICENSE для получения дополнительной информации.

About

Разработка программы по сбору и систематизации данных о более 850 тыс. кинофильмов с сайта Letterboxd.com. Анализ данных.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published