Этот репозиторий содержит ноутбуки с задачами по обработке естественного языка (NLP), в которых используются разные инструменты для предобработки текста, токенизации, лемматизации и анализа отзывов.
nlphw1.ipynb — анализ отзывов на основе датасета с Kaggle, предобработка данных, работа со стоп-словами и морфологическим анализом.
nlphw2.ipynb — работа с корпусами текстов, морфологический разбор с использованием библиотек pymorphy2, natasha и conllu, а также работа с токенизацией и частотным анализом.
nltkpymorphy2sklearnnatashapandasconllu