Skip to content

Commit

Permalink
Update disambiguator.cg3
Browse files Browse the repository at this point in the history
Add high-frequency word forms with proper noun homography.
  • Loading branch information
rueter committed Oct 21, 2024
1 parent 8aeaecc commit 1fa5e4c
Showing 1 changed file with 5 additions and 0 deletions.
5 changes: 5 additions & 0 deletions src/cg3/disambiguator.cg3
Original file line number Diff line number Diff line change
Expand Up @@ -494,6 +494,10 @@ SUBSTITUTE (<W:0.0>) (<W:1.0>) TARGET Abl IF (0 Nom) (0* (ScSg3) BARRIER BOS OR
#Фкя сяканять арафтсаськ шить каршес, а омбоцеть путсаськ шобда вастс, коса аф уленди ши [валда].
# deal with вал : валда, пан : панда

SUBSTITUTE (<W:0.0>) (<W:1.0>) TARGET (Sg Nom Indef) IF (0 ("Аля") OR ("Мар") OR ("Тунда") OR ("Ялга") OR ("Тянь") OR ("Синь") OR ("Весь") OR ("Коза") OR ("Вага"))
# proper nouns vs high-frequency words : Аля=аля+N+Sg+Nom+Indef, Мар=мар+Sg+Nom+Indef, Тунда=тунда+N+Sg+Nom+Indef, Ялга=ялга+N+Sg+Nom+Indef,
#Тянь=тя+Pron+Sg+Gen+Indef, Синь=сон+Pron+Pers+Pl+Gen/+Pron+Pers+Pl+Nom, Весь=ве+N+Sg+Nom+Def, Коза=коза, Вага=вага+Interj

MAP (@CVP) TARGET CC IF (*-1 (VFIN) BARRIER CLB OR BOS LINK *1 (VFIN) BARRIER CLB OR EOS);
MAP (@CVP) TARGET CC IF (*1 (VFIN) BARRIER CLB OR EOS LINK *-1 (VFIN) BARRIER CLB OR BOS);
#и :тейсь прязонзо пизэ и ливтсь левкст.
Expand Down Expand Up @@ -543,6 +547,7 @@ REMOVE ("уша" Abl Indef Clt/Cop Prs ScSg2) OR ("уша" Abl Indef Clt/Cop Prs
#ушедат: Колмоце книгать ушедат лувомонза,— и сельмотне коневихть.
REMOVE PxSg2 OR Ex/Num IF (0 (A Ord));


# минь -- мимс
REMOVE:NotVerbWhenPronPersPl1Gen ("мимс" V) IF (0 (Pron Pers Pl1 Gen)) (1 PxPl1);
#минь партияньконь пяк оцю заботац
Expand Down

0 comments on commit 1fa5e4c

Please sign in to comment.