⏳ xLSTM-LM : xLSTMを用いた言語モデルの学習

💫 概要

このリポジトリは、xLSTMを用いた言語モデルを学習するコードを実装したものです。
論文「xLSTM: Extended Long Short-Term Memory」に基づいて実装しています。

📎 ファイル構成

.
├── Makefile : Lint・Formatを実行するためのMakefile
├── README.md
├── cmd
│   ├── docker.sh : Dockerコンテナのビルドとコンテナ起動するためのスクリプト
│   └── train.sh : 学習を実行するためのスクリプト
├── docker
│   └── Dockerfile
├── environment.yaml : conda環境の設定ファイル
├── pyproject.toml
├── requirements-dev.lock
├── requirements.lock
├── src
│   ├── cfg
│   │   ├── config_type.py
│   │   ├── load_yaml_cfg.py
│   │   └── yaml : 学習時の設定ファイル
│   │       ├── 1.3b
│   │       │   └── config.yaml
│   │       ├── 125m
│   │       │   └── config.yaml
│   │       ├── 2.7b
│   │       │   └── config.yaml
│   │       ├── 350m
│   │       │   └── config.yaml
│   │       └── template
│   │           └── config.yaml
│   ├── dataset : データセットの読み込みを行うクラス
│   │   ├── ja_cc_dataset.py
│   │   ├── ja_wiki_dataset.py
│   │   ├── nlp_dataset.py
│   │   └── slim_pajama_dataset.py
│   ├── experiment : 実験のためのクラス
│   │   ├── setup
│   │   │   ├── criterion.py
│   │   │   ├── dataset.py
│   │   │   ├── lr_scheduler.py
│   │   │   ├── model.py
│   │   │   └── optimizer.py
│   │   ├── test
│   │   │   └── generate.py
│   │   └── train
│   │       ├── train.py
│   │       └── trainer.py
│   ├── model : モデルの読み込みを行うクラス
│   │   └── xlstm_model_wrapper.py
│   └── utils.py
└── tests

📚 使用ライブラリ

🤖 main-dependencies

xlstm : NX-AI社が公開しているxLSTMの公式実装
transformers : tokenizerの読み込みに使用
datasets : データセットの読み込みに使用
omegaconf : 設定ファイルの読み込みに使用
pyTorch : モデルの学習に使用
wandb : ログの保存に使用

🧑‍💻 dev-dependencies

ruff : Linter・Formatter
mypy : 型チェック

✍️ 学習方法

🗳️ Dockerを用いたconda環境での学習

.envの作成

wandbのAPIキーを.envに記述してください。

$ cp .env.sample .env

Dockerコンテナのビルド

$ bash cmd/docker.sh build

Dockerコンテナの起動

$ bash cmd/docker.sh shell [GPU_ID](ex. 0,1,2,3)

学習の実行

$ bash cmd/train.sh docker [CONFIG_PATH](ex. src/cfg/yaml/1.3b/config.yaml)

🏠 ローカル環境での学習

依存関係の解決

Ryeを用いる場合

$ rye sync

pipを用いる場合

$ pip install -r requirements.lock
$ source .venv/bin/activate

wandbへのログイン

$ (rye run) wandb login

※ pipを利用している場合、(rye run)を削除してください。

学習の実行

$ bash cmd/train.sh local [CONFIG_PATH](ex. src/cfg/yaml/1.3b/config.yaml)

※ pipを利用している場合、cmd/train.shのrye run pythonをpythonに変更してください。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

⏳ xLSTM-LM : xLSTMを用いた言語モデルの学習

💫 概要

📎 ファイル構成

📚 使用ライブラリ

🤖 main-dependencies

🧑‍💻 dev-dependencies

✍️ 学習方法

🗳️ Dockerを用いたconda環境での学習

🏠 ローカル環境での学習

About

Releases 3

Packages

Contributors 2

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 196 Commits
.github/workflows		.github/workflows
cmd		cmd
docker		docker
src		src
tests		tests
.dockerignore		.dockerignore
.env.sample		.env.sample
.gitignore		.gitignore
.python-version		.python-version
Makefile		Makefile
README.md		README.md
environment.yaml		environment.yaml
pyproject.toml		pyproject.toml
requirements-dev.lock		requirements-dev.lock
requirements.lock		requirements.lock

lovelovetrb/xlstm-lm

Folders and files

Latest commit

History

Repository files navigation

⏳ xLSTM-LM : xLSTMを用いた言語モデルの学習

💫 概要

📎 ファイル構成

📚 使用ライブラリ

🤖 main-dependencies

🧑‍💻 dev-dependencies

✍️ 学習方法

🗳️ Dockerを用いたconda環境での学習

🏠 ローカル環境での学習

About

Topics

Resources

Stars

Watchers

Forks

Releases 3

Packages 0

Contributors 2

Languages

Packages