Skip to content

Latest commit

 

History

History
27 lines (15 loc) · 1.24 KB

README.md

File metadata and controls

27 lines (15 loc) · 1.24 KB

IsanNLP

corpus licensed under CC-BY 3.0

The Isan NLP porject want to develop Northeast Thailand local language tool for natural language processing tasks and want to preserve these languages.

Isan NLP เป็นโครงการพัฒนาการประมวลผลภาษาท้องถิ่นของภาคตะวันออกเฉียงเหนือ

ภาษาอีสานไม่มีจริง - อ้างอิง ไม่มีภาษาอีสานในโลกใบนี้ : อีสานใหม่

สาเหตุที่พัฒนา เพื่ออนุรักษ์ภาษาถิ่นในพื้นที่ภาคตะวันออกเฉียงเหนือของประเทศไทย

Support language

  • Korat language (ภาษาโคราช) - List word only
  • Nangrong language (ภาษานางรอง) - List word, Thai words, a few wordnet id, a few example.
  • Phu Thai language (ภาษาผู้ไท) - WIP

Features

  • Word tokenizer with korat words and nangrong words

WIP

Install

pip install IsanNLP