Skip to content

edaersu/Zemberek-in-Jupyter-Notebook

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 

Repository files navigation

Zemberek kütüphanesini Jupyter Notebook'da Kullanma

Zemberek, açık kaynak kodlu Türkçe Doğal dil işleme kütüphanesidir.Tamamen Java ile geliştirilen kütüphane, yazım denetimi, hatalı kelimeler için öneri, heceleme, deascifier, hatalı kodlama temizleme gibi işlevlere sahiptir.
Python kodu içerisinde bu kütüphaneyi kullanabilmemiz için JVM(Java sanal makinesi) ve bazı jar dosyalarının pathlerini kodda belirtmemiz gerekiyor.

Adımlar:
1-Java kurulumu
2-Kullanılacak jar dosya/dosyalarını indirme
2-Path değişkenlerini belirleme
Runn :)

1- Bilgisayarınızda Java kurulu değil ise buradan Java yazılımını indirip kurmanız gerekiyor.

2-Daha sonra buradan güncel zemberek jar dosyasını indirebilirsiniz. Eğer 1'den fazla jar dosyasını aynı notebook üzerinde kullanmak istiyorsanız hepsini indirip tek tek pathlerini tanımlayıp bunu bir listede tutabilirsiniz. (zemberek-örnek.ipynb'da olduğu gibi)
Örnek olarak bu repodaki "zemberek-tum-2.0.jar" dosyasını kullanabilirsiniz.

3- Benim bilgisayarımda;
jvm.dll >> "C:\Program Files\Java\jdk-11.0.8\bin\server\jvm.dll"
zemberek-tum-2.0.jar >> "C:\Users\Eda\Desktop\zemberek\zemberek-tum-2.0.jar"
şeklinde adreslerde bulunuyor. Sizde indirme işlemlerinden sonra bu pathleri belirleyip zemberek-örnek.ipynb içerisinde değiştirmeniz gerekiyor.

**Son olarak Notebook'da kullanılan bir diğer jar dosyası "zemberek-full.jar" dosyasını buradan indirerek path'i jar2 değişkenine atarsanız notebook sorunsuz çalışacaktır.(Dosya boyutu dolayısıyla repoya koyamadım)

"zemberek-full.jar" içerisindeki class ve methodlara ise bu repodan erişebilirsiniz