| license | language | pretty_name | size_categories | task_categories | tags | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
mit |
|
Uyghur Socio-Political Articles Dataset |
|
|
|
This repository contains a curated dataset of 109+ Uyghur articles. This is an actively maintained project, and new content is added regularly.
بۇ ئامباردا جەمئىي 109 پارچىدىن ئارتۇق ماقالە جەملەندى. بۇ سانلىق مەلۇمات توپلىمى ئاكتىپ يېڭىلىنىپ تۇرىدىغان تۈر بولۇپ، يېڭى ماقالىلەر قوشۇلۇپ تۇرىدۇ.
- Status: Active / ئاكتىپ
- Update Frequency: Regular updates / يېڭىلىنىپ تۇرىدۇ
- Current Count: 109 articles (As of Feb 2026)
- Format:
.jsonl(UTF-8) - Authors: Burhan Muhammed, Enwer Haji Muhammed (Erturk), Karimjan Ghafuri, Mahmud Muhiti, Muhammad Amin Bughra, etc.
Developers can integrate this dataset using the Hugging Face datasets library:
from datasets import load_dataset
# Load the dataset
dataset = load_dataset("Uyghur-Corpus/Uyghur-Corpus")
# Access an article
print(dataset['train'][0]['content'])