Universal Transformer

Authors:

Caterina Roncalli (caterina.roncalli@studium.uni-hamburg.de)
Imran Ibrahimli (imran.ibrahimli@studium.uni-hamburg.de)

Reference paper:

https://openreview.net/forum?id=HyzdRiR9Y7

Setup

First, clone this repository:

git clone https://github.com/iibrahimli/universal_transformers.git

Then, create a virtual environment and install the dependencies in requirements.txt:

# change to the directory of the repository
cd universal_transformers

# create venv named ut_venv
python3 -m venv ut_venv

# activate venv
source ut_venv/bin/activate

# update pip & install dependencies
pip install -U pip
pip install -r requirements.txt

Training

To train the model, we strongly advise using multiple GPUs.

Algorithmic tasks

The algorithmic tasks are randomly generated.

python train_algorithmic.py

WMT-14 EN-DE

Training the model on WMT-14 EN-DE dataset is implemented using PyTorch Distributed and therefore is run via torchrun. The training script is train_wmt14.py.

torchrun --standalone \
         --nnodes=1 \
         --nproc_per_node=<N_GPUS>\
         train_wmt14.py \
         --batch_size 32 \
         --max_seq_len 100 \
         --lr_mul 0.2

where <N_GPUS> is the number of GPUs you want to use.

Name		Name	Last commit message	Last commit date
Latest commit History 183 Commits
model		model
notebooks		notebooks
results/wmt14		results/wmt14
utils		utils
.gitignore		.gitignore
README.md		README.md
algorithmic_data_utils.py		algorithmic_data_utils.py
algorithmic_generators.py		algorithmic_generators.py
deb_alg_gen.py		deb_alg_gen.py
eval_wmt14.py		eval_wmt14.py
load_and_generate.py		load_and_generate.py
multi30k.py		multi30k.py
plot_ponder.py		plot_ponder.py
requirements.txt		requirements.txt
train_algorithmic.py		train_algorithmic.py
train_wmt14.py		train_wmt14.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Universal Transformer

Setup

Training

Algorithmic tasks

WMT-14 EN-DE

About

Releases

Packages

Contributors 2

Languages

iibrahimli/universal_transformers

Folders and files

Latest commit

History

Repository files navigation

Universal Transformer

Setup

Training

Algorithmic tasks

WMT-14 EN-DE

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages