Skip to content

2 курс, 1 триместр. Финальный проект в рамках предмета Теория Информации в университете Иннополис.

License

Notifications You must be signed in to change notification settings

revlze/compression-authorship

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

176 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Cтруктура проекта

.
├── README.md
├── PLAN.md   
├── requirements.txt
├── experiments.ipynb      # Ноутбук, в котором запускаются эксперименты
│
├── data/
│   ├── raw/{author_name}/              # Сырые тексты авторов
│   └── processed/
│       └── {author_name}/
│           └── {case}_{punct}_{stop}/  # Варианты предобработки
│               ├── Train.txt
│               ├── Test.txt
│               ├── meta.json
│               └── {num}_slices/       # Нарезанный тест на кусочки
│                   ├── 0_slice.txt
│                   ├── ...
│                   └── n_slice.txt
│
└── src/
    ├── theory.py          # Реализация метрик и построение таблицы
    ├── data_pipeline.py   # Загрузка/обработка/формирование текстов
    ├── compressors.py     # Работа с gzip/bzip2/и т.п.
    ├── neural_method.py   # Нейросетевой метод / перплексия
    └── preprocessing.py   # Предобработка данных

About

2 курс, 1 триместр. Финальный проект в рамках предмета Теория Информации в университете Иннополис.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •