Skip to content

Генератор произвольного облака слов на основе веб-страницы с текстом формата *.txt или страницы Википедии. Используются библиотеки request, re, nltk, natasha, matplotlib, wikipedia, wordcloud.

License

Notifications You must be signed in to change notification settings

dump78/word_cloud_generation

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

word_cloud_generation

Генератор облака слов на основе текста в формате *.txt или страницы Википедии.

Используемые библиотеки

Текст очищается от знаков препинания и специальных символов с помощью регулярных выражений (библиотека re), очищается от стоп-слов и лемматизируется с помощью библиотеки NLTK.

Цели проекта

  1. Изучение библиотек request, re, nltk, natasha, matplotlib, wikipedia, wordcloud.
  2. Создание инструмента, который может использоваться для обучающих, исследовательских и личных целей.

Требования

Для использования программы требуется Jupyter Notebook (https://jupyter.org/try).

About

Генератор произвольного облака слов на основе веб-страницы с текстом формата *.txt или страницы Википедии. Используются библиотеки request, re, nltk, natasha, matplotlib, wikipedia, wordcloud.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published