From 1fa5e4cdc189e768aa2f5adff74a4e68dbb02bb5 Mon Sep 17 00:00:00 2001 From: Jack Rueter Date: Mon, 21 Oct 2024 10:38:22 +0300 Subject: [PATCH] Update disambiguator.cg3 Add high-frequency word forms with proper noun homography. --- src/cg3/disambiguator.cg3 | 5 +++++ 1 file changed, 5 insertions(+) diff --git a/src/cg3/disambiguator.cg3 b/src/cg3/disambiguator.cg3 index 5afe44d8..1177e9e6 100644 --- a/src/cg3/disambiguator.cg3 +++ b/src/cg3/disambiguator.cg3 @@ -494,6 +494,10 @@ SUBSTITUTE () () TARGET Abl IF (0 Nom) (0* (ScSg3) BARRIER BOS OR #Фкя сяканять арафтсаськ шить каршес, а омбоцеть путсаськ шобда вастс, коса аф уленди ши [валда]. # deal with вал : валда, пан : панда +SUBSTITUTE () () TARGET (Sg Nom Indef) IF (0 ("Аля") OR ("Мар") OR ("Тунда") OR ("Ялга") OR ("Тянь") OR ("Синь") OR ("Весь") OR ("Коза") OR ("Вага")) +# proper nouns vs high-frequency words : Аля=аля+N+Sg+Nom+Indef, Мар=мар+Sg+Nom+Indef, Тунда=тунда+N+Sg+Nom+Indef, Ялга=ялга+N+Sg+Nom+Indef, +#Тянь=тя+Pron+Sg+Gen+Indef, Синь=сон+Pron+Pers+Pl+Gen/+Pron+Pers+Pl+Nom, Весь=ве+N+Sg+Nom+Def, Коза=коза, Вага=вага+Interj + MAP (@CVP) TARGET CC IF (*-1 (VFIN) BARRIER CLB OR BOS LINK *1 (VFIN) BARRIER CLB OR EOS); MAP (@CVP) TARGET CC IF (*1 (VFIN) BARRIER CLB OR EOS LINK *-1 (VFIN) BARRIER CLB OR BOS); #и :тейсь прязонзо пизэ и ливтсь левкст. @@ -543,6 +547,7 @@ REMOVE ("уша" Abl Indef Clt/Cop Prs ScSg2) OR ("уша" Abl Indef Clt/Cop Prs #ушедат: Колмоце книгать ушедат лувомонза,— и сельмотне коневихть. REMOVE PxSg2 OR Ex/Num IF (0 (A Ord)); + # минь -- мимс REMOVE:NotVerbWhenPronPersPl1Gen ("мимс" V) IF (0 (Pron Pers Pl1 Gen)) (1 PxPl1); #минь партияньконь пяк оцю заботац