Skip to content

Latest commit

 

History

History
122 lines (84 loc) · 3.16 KB

README.md

File metadata and controls

122 lines (84 loc) · 3.16 KB

Kursus "Sissejuhatus arvutimorfoloogiasse"

Kava

4.09 Teooria: Mis on morfoloogia; produktiivsed käändtüübid

11.09 Teooria: Lõplikud muundurid

18.09 Praktika: HFST süsteem üles sättida. Leksikoni kirjeld. lexc-formaadis Kodutöö: 10 käändsõna lexc formaadis täisparadigmadena (peaaegu...)

25.09 Praktika: twolc. Fonotaktika kirjeldamine twolc-formaadis Kodutöö: astmevahelduse kajastamine twolc formaadis

02.10 Praktika: xfst. Sümbolite teisendamine: suurtähed väikseks (ka arvestades konteksti); muundurite kombineerimine Kodutöö: vigase ortograafia modelleerimine

09.10 Praktika: lexc. Tuletuse kirjeld. lexc-formaadis Kodutöö: 4 tuletusliidet lexc formaadis

16.10 Praktika: xfst. Muundurite kombineerimine; filtrid: paarissõnad Kodutöö: kombinatoorika piiramine

23.10 Praktika: xfst. Muundurite kombineerimine; liitsõnamoodustus Kodutöö: kombinatoorika piiramine

30.10 Praktika: lexc lipudiakriitikud liitsõnamoodustuse piiramisel kodutöö: kombinatoorika piiramine

06.11 Praktika: lexc. Sõnamallide kirjeldamine oletamiseks Kodutöö: produktiivsed käändsõnamallid

13.11 Praktika: lexc, xfst Analüüside järjestamine ja kaalud Kodutöö: kaalud leksikoni ja muundurisse

20.11 Praktika: xfst Silbitaja, mis oskab arvestada liitsõna struktuuri Kodutöö: vigase ortograafia parandaja (omaloodud sõnavara ulatuses) või võõrsõnade maakeelestaja (häälduspärane kirjapilt + käänamisviis)

27.11 Praktika: Python Muunduri kasutamine Pythonis Kodutöö: oma muunduri poolt ära tuntavate sõnade järjestamine korpuses esinemise sageduse alusel või korpuse vigase ortograafia parandamine (omaloodud sõnavara ulatuses)

4.12 Kokkuvõte ja arutelu


Kirjandus

  1. Kenneth R. Beesley, Lauri Kartunen. Finite State Morphology. CSLI 2003 https://web.stanford.edu/~laurik/fsmbook/home.html (twolc kirjeldav peatükk, mis raamatust välja jäi: https://web.stanford.edu/~laurik/.book2software/)

  2. Helsingi FST - muundurite tarkvara https://github.com/hfst

  3. Eesti keele morfoloogia muundurid https://github.com/giellalt/lang-est-x-utee


Iga praktikumi järel antakse koduseks ülesandeks ühe muunduri loomine ja see on praktikumis alustatu lõpuleviimine. Ülesande lahendus peab olema ära saadetud hiljemalt järgmise nädala teisipäeva hommikuks kl 10.00. Lahenduse kohta tuleb esitada ka omapoolne kommentaar või küsimused ja seda eriti juhul, kui head lahendust ei õnnestu saavutada.

Järgnev praktikum algab esitatud tööde kommenteerimise ja küsimustele vastamisega.


Hinne kujuneb koduülesannete alusel.

Kokku on 11 ülesannet.

Muundur teeb rohkem ja/või elegantsemalt kui varasema õpetuse pealt võiks oodata - 5 p

Muundur teeb seda, mida vaja ja kommentaarid-küsimused viitavad lisavõimalustele - 4 p

Muundur teeb seda, mida vaja - 3 p Muundur ei tee päris seda, mida vaja; tudeng esitab puuduste kohta küsimusi ja/või omapoolseid seletusi - 2 p

Muundur kas a) ei tee üldse seda, mida vaja, või b) ei tee päris seda, mida vaja ning tudeng ei esita ka ühtegi probleemi ega küsimust - 1 p

Hinne Punkte
A 55-33
B 31-27
C 26-22
D 21-17
E 16-11