Create dataset loader for multilingual-NLI-26lang-2mil7 #583

SamuelCahyawijaya · 2024-04-01T08:59:22Z

Dataset	multilingual_nli_26lang
Description	This dataset contains 2 730 000 NLI text pairs in 26 languages spoken by more than 4 billion people. The dataset can be used to train models for multilingual NLI (Natural Language Inference) or zero-shot classification. The dataset is based on the English datasets MultiNLI, Fever-NLI, ANLI, LingNLI and WANLI and was created using the latest open-source machine translation models.
Subsets	-
Languages	ind, vie, eng
Tasks	Natural Language Inference
License	Unknown (unknown)
Homepage	https://huggingface.co/datasets/MoritzLaurer/multilingual-NLI-26lang-2mil7
HF URL	https://huggingface.co/datasets/MoritzLaurer/multilingual-NLI-26lang-2mil7
Paper URL	https://www.cambridge.org/core/journals/political-analysis/article/less-annotating-more-classifying-addressing-the-data-scarcity-issue-of-supervised-machine-learning-with-deep-transfer-learning-and-bertnli/05BB05555241762889825B080E097C27

akhdanfadh · 2024-04-01T10:56:38Z

#self-assign

Closes #583 | Add Dataloader multilingual-NLI-26lang-2mil7

github-actions bot assigned akhdanfadh Apr 1, 2024

akhdanfadh mentioned this issue Apr 1, 2024

Closes #583 | Add Dataloader multilingual-NLI-26lang-2mil7 #598

Merged

8 tasks

akhdanfadh added the pr-ready A PR that closes this issue is Ready to be reviewed label Apr 2, 2024

yongzx closed this as completed in #598 May 5, 2024

yongzx added a commit that referenced this issue May 5, 2024

Merge pull request #598 from akhdanfadh/multilingual_nli_26lang

9c671fa

Closes #583 | Add Dataloader multilingual-NLI-26lang-2mil7

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Create dataset loader for multilingual-NLI-26lang-2mil7 #583

Create dataset loader for multilingual-NLI-26lang-2mil7 #583

SamuelCahyawijaya commented Apr 1, 2024

akhdanfadh commented Apr 1, 2024

Create dataset loader for multilingual-NLI-26lang-2mil7 #583

Create dataset loader for multilingual-NLI-26lang-2mil7 #583

Comments

SamuelCahyawijaya commented Apr 1, 2024

akhdanfadh commented Apr 1, 2024