Skip to content

Releases: PyThaiNLP/pythainlp

PyThaiNLP 2.2.2

09 Jul 22:37
Compare
Choose a tag to compare

This release is a bug fix release.

Installation

  • You can install or upgrade using pip install -U pythainlp

More information

We build Thai NLP

PyThaiNLP Team

PyThaiNLP 2.2.1

27 Jun 14:01
c534140
Compare
Choose a tag to compare

This release is a bug fix release.

  • Fix %O modifier for thai_strftime() #441
  • Fix db.json #442

Installation

  • You can install or upgrade using pip install -U pythainlp

More information

We build Thai NLP

PyThaiNLP Team

PyThaiNLP 2.2.0

24 Jun 14:07
980d104
Compare
Choose a tag to compare

English

Hello World. Today, we're happy to announce the availability of PyThaiNLP. It has been four years since PyThaiNLP's the first release. Thank you very much for supporting PyThaiNLP.

Summary – Release Highlights

New Features

Tokenizer

  • Fix longest engine, last character is now consumed
  • Add CRFCut sentence segmentation

Transliteration

  • Add Thai Grapheme-to-Phoneme (Thai G2P) deep learning sequence-to-sequence model

Normalization

  • Add more normalize functions, like remove zero-width characters, remove duplicate spaces, etc.

Utilities

  • Add thaiword_to_date() and thaiword_to_time()
  • Fix countthai() to handle a case where the text has only numbers and symbols

Command line

Others

  • Code improvement: Move non-init code out of init.py files, etc.
  • Remove dependency: Unigram POS tagger no longer need NLTK module

Installation

You can install or upgrade using pip install -U pythainlp

Change log: #330

Documentation: https://www.thainlp.org/pythainlp/docs/2.2/

Tutorials: https://thainlp.org/pythainlp/tutorials/

GitHub: https://github.com/PyThaiNLP/pythainlp

We build Thai NLP

PyThaiNLP Team

ภาษาไทย

สวัสดีชาวโลก วันนี้ 24 มิถุนายน 2563 พวกเราได้ปล่อย PyThaiNLP 2.2 ตอนนี้ PyThaiNLP อายุครบ 4 ปี ขอบคุณที่ใช้ PyThaiNLP :)

สรุป – สิ่งที่สำคัญ

คุณลักษณะใหม่

ตัวตัดข้อความ

  • แก้ไขตัวตัดคำ longest
  • เพิ่มตัวตัดประโยค CRFCut

ถอดเสียง

  • เพิ่มการถอดเสียงภาษาไทยเป็น IPA ด้วย Thai Grapheme-to-Phoneme (Thai G2P)

Normalization

  • เพิ่มเติมความสามารถให้กับฟังก์ชัน normalize เช่น ลบช่องว่างซ้ำกัน เป็นต้น

เครื่องมือ

  • เพิ่ม thaiword_to_date() และ thaiword_to_time()
  • ปรับปรุง countthai()

Command line

  • ปรับปรุงคำสั่ง command และไวยากรณ์ sub-command - ดูเพิ่มเติมได้ที่ command line docs

อื่น ๆ

  • ปรับปรุงโค้ด: ย้ายโค้ดออกจากไฟล์ init.py เป็นต้น
  • ลดความต้องการไลบรารีภายนอก: Unigram POS tagger สามารถทำงานได้โดยไม่ต้องการ NLTK

การติดตั้ง

สามารถติดตั้งหรือปรับรุ่นได้ด้วยคำสั่ง pip install -U pythainlp

Change log: #330

Documentation: https://www.thainlp.org/pythainlp/docs/2.2/

Tutorials https://thainlp.org/pythainlp/tutorials/

GitHub: https://github.com/PyThaiNLP/pythainlp

พวกเราสร้าง Thai NLP

ทีม PyThaiNLP

PyThaiNLP 2.2.0-beta1

15 Jun 13:29
8512bf8
Compare
Choose a tag to compare
PyThaiNLP 2.2.0-beta1 Pre-release
Pre-release

This the first beta version of PyThaiNLP 2.2.

Installation

pip install --pre pythainlp

PyThaiNLP 2.2 change log #330

Documentation : https://www.thainlp.org/pythainlp/docs/dev/

Report bug : https://github.com/PyThaiNLP/pythainlp/issues

We build Thai NLP.

PyThaiNLP Team

PyThaiNLP 2.2.0-dev1

23 May 11:31
841a4a5
Compare
Choose a tag to compare
PyThaiNLP 2.2.0-dev1 Pre-release
Pre-release

Dev version For developer only

PyThaiNLP 2.2 change log #330

Documentation : https://www.thainlp.org/pythainlp/docs/dev/

PyThaiNLP 2.2.0-dev0

01 May 17:45
Compare
Choose a tag to compare
PyThaiNLP 2.2.0-dev0 Pre-release
Pre-release

Dev version For developer only

PyThaiNLP 2.2 change log #330

Documentation : https://www.thainlp.org/pythainlp/docs/dev/

PyThaiNLP 2.1.4

07 Feb 22:17
Compare
Choose a tag to compare

This release is a bug fix release.

  • Remove NumPy and pandas requirements from base install (#353)
  • Fix longest matching bug (fail when the entire input text is a full word) (#357)

PyThaiNLP 2.1.3

11 Jan 04:08
8922b91
Compare
Choose a tag to compare

This release is a bug fix release.

  • numtoword number to thai word (#350)

Installation

You can install or upgarde from pip install -U pythainlp

Change log: #181

Documentation: https://www.thainlp.org/pythainlp/docs/2.1/

Tutorials: https://thainlp.org/pythainlp/tutorials/

GitHub: https://github.com/PyThaiNLP/pythainlp

We build Thai NLP

PyThaiNLP Team

PyThaiNLP 2.1.2

31 Dec 11:41
c3f223c
Compare
Choose a tag to compare

This release is a bug fix release.

  • thainer html-like output: Fixed output of the html-like is incorrect. (#346)

Installation

You can install or upgarde from pip install -U pythainlp

Change log: #181

Documentation: https://www.thainlp.org/pythainlp/docs/2.1/

Tutorials: https://thainlp.org/pythainlp/tutorials/

GitHub: https://github.com/PyThaiNLP/pythainlp

We build Thai NLP

PyThaiNLP Team

PyThaiNLP 2.1.1

19 Dec 14:56
8369a21
Compare
Choose a tag to compare

This release is a bug fix release.

  • newmm word tokenizer: Add graph size limit in _onecut() to avoid long wait for ambiguous text (#333)

Installation

You can install or upgarde from pip install -U pythainlp

Change log: #181

Documentation: https://www.thainlp.org/pythainlp/docs/2.1/

Tutorials: https://thainlp.org/pythainlp/tutorials/

GitHub: https://github.com/PyThaiNLP/pythainlp

We build Thai NLP

PyThaiNLP Team