From 9ba596f0fac037424488cbb3271a7cb4f5d85eb5 Mon Sep 17 00:00:00 2001 From: Jack Rueter Date: Fri, 13 Oct 2023 10:04:27 +0300 Subject: [PATCH] Work with N_ANDY types --- src/fst/phonology.twolc | 15 +++++++++------ src/fst/stems/N_mdf2x.lexc | 14 +++++++------- src/fst/stems/N_mdf2x.xml | 20 ++++++++++---------- src/fst/stems/V_mdf2x.lexc | 8 ++++---- src/fst/stems/V_mdf2x.xml | 16 ++++++++-------- src/fst/stems/exceptions.lexc | 4 ++++ src/fst/stems/nouns_newwords.lexc | 4 +++- src/fst/stems/verbs_newwords.lexc | 3 ++- 8 files changed, 47 insertions(+), 37 deletions(-) diff --git a/src/fst/phonology.twolc b/src/fst/phonology.twolc index 67d85a7f..a96540b7 100644 --- a/src/fst/phonology.twolc +++ b/src/fst/phonology.twolc @@ -269,7 +269,7 @@ Rules !!≈ ## The @CODE@ "%{ИЫЙ%}:j" !! **@RULENAME@** -%{ИЫЙ%}:й <=> [ я | а | у | и | ю] %> _ [ # | %- | » | %> в о к | ( %> ) х т ь | %> [с|д|т] | х т е | н е | т ь ] ; +%{ИЫЙ%}:й <=> [ я | а | у | и | ю] %> _ [ # | %- | » | %> в о к | ( %> ) х т ь | %> [с|д|т] | х т е | н е | т ь | %> %{Х%}: т] ; !!€ стя%>%{ИЫЙ%}%>сь !!€ стя%>й%>сь !! мумс+V+Ind+Prt1+ScSg1+OcSg2: **find/löytää** @@ -287,7 +287,7 @@ Rules !!≈ ## The @CODE@ "%{ИЫЙ%}:0" -!! **@RULENAME@** +!! **@RULENAME@** %{ИЫЙ%}:0 <=> [ я | а ] %> _ [ й: | %> %{АЯ%}:] ; !! араламс+V+Der/NomAg+Sg+Nom+PxSg3: **protect/puolustaa** !!€ арала%>%{ИЫЙ%}й%>%{ЕОØ%}ц @@ -556,6 +556,7 @@ Vx:0 <=> !! **@RULENAME@** я:а <=> [CnsNonDent:|%{DIM%}:к] _ %^Я2А: %> [%{ЕОØ%}: [(н) ц| н т|н з|з %>| (н) к с] |%{вгк%}: %{АЕ%}:| %{Х%}: т %{ЬØ%}: [#|%-|%>]|ф т о м| д %{АО%}: |ш к а|с [#|%-|%>]|с (т) %{АО%}: |%{ВИУ%}:|с н %{АО%}:] ; + %{DIM%}:к _ %> [(н) ц| н з|з %>| (н) к с |ф т о м | д %{АО%}: |ш к а|с [#|%-|%>]|с (т) %{АО%}: |с н %{АО%}: ] ; ! Cns: _ %^Я2А: %> ; !!рьвя+N+Sg+Gen+PxSg3: __wife/vaimo__ !!€ рьвя%^Я2А%>%{ЕОØ%}нц @@ -709,12 +710,13 @@ Vx:0 <=> й:0 <= [ :Vows| Vows %> %{ИЫЙ%}:] _ [ %> %{ВИУ%}: | %> %{АЕØ%}:| %> %{ЕОØ%}:е | %> %{ИЫЙ%}:и | %> [%{АЯ%}:я | %{АО%}: [ :Cns | К3:0 | # | %- ]] ] ; !!€ тий>{ЕОØ}за !!€ ти0>еза - Vows CnsAndSoft+ [и|ы] _ %> %{Х%}: т: ; + [Vows CnsAndSoft+|к ш н] [и|ы] _ %> %{Х%}: т: ; т и [й: %> %{ИЫЙ%}: |и] _ %> %{Х%}: т: ; !! седи+N+Pl+Nom+Indef **heart/sydän** !!€ седий%>%{Х%}т%{ЬØ%} !!€ седи0%>хть - [ е: |ь: | Cns |Vows ] %> %{ИЫЙ%}: _ %> %{Х%}: ; + [ е: |ь: | Cns ] %> %{ИЫЙ%}: _ %> %{Х%}: ; + [Vows - [а|я]] %> %{ИЫЙ%}: _ %> %{Х%}: ; ! [ е: |ь: | CnsNonDent |Vows ] %> %{ИЫЙ%}: _ %> %{Х%}: ; !! корхнемс+V+NomAg+Pl+Nom+Def: **visit, talk/jutella** !!€ корхне%>%{ИЫЙ%}й%>%{Х%}тне @@ -734,12 +736,12 @@ Vx:0 <=> !!€ ти00еза !С а р а н с к я й:0 > {ВИУ}:и - Vows CnsAndSoft+ [и|ы] _ %> %{Х%}: т: ; + [Vows CnsAndSoft+|к ш н] [и|ы] _ %> %{Х%}: т: ; т и [й: %> %{ИЫЙ%}: |и] _ %> %{Х%}: т: ; !! седи+N+Pl+Nom+Indef **heart/sydän** !!€ седий%>%{Х%}т%{ЬØ%} !!€ седи0%>хть - [ е: |ь: | Cns |Vows ] %> %{ИЫЙ%}: _ %> %{Х%}: ; + [ е: |ь: | Cns |Vows - [а|я]] %> %{ИЫЙ%}: _ %> %{Х%}: ; ! [ е: |ь: | CnsNonDent |Vows ] %> %{ИЫЙ%}: _ %> %{Х%}: ; %{ИЫЙ%}: _ %> %{ЕОØ%}: ; !! араламс+V+Der/NomAg+Sg+Nom+PxSg3: **protect/puolustaa** @@ -799,6 +801,7 @@ Vx:0 <=> !! ваны+N+Pl+Nom+Def **watcher/katsoja** !!€ ваный%>%{Х%}тне !!€ ваны0%>х0не +!р а б о т а > {ИЫЙ}:0 й > {Х}:х т ь "м:п ям" !! **@RULENAME@** diff --git a/src/fst/stems/N_mdf2x.lexc b/src/fst/stems/N_mdf2x.lexc index e8076f93..949cec55 100644 --- a/src/fst/stems/N_mdf2x.lexc +++ b/src/fst/stems/N_mdf2x.lexc @@ -2712,7 +2712,7 @@ LEXICON N_mdf2x крушения+N:крушения N_AVA "" ; крф+N:кърф N_KAL "kuorsaus" ; крфама+N:кърфама N_AVA "kyteminen" ; -крхкалма+N:кърхкалма N_AVA "syvyys" ; +крхкалма+N:кърхкалм%{АО%} N_PULA "syvyys" ; крхмадема+N:крхмадема N_AVA "" ; крхматьфтема+N:крхматьфтема N_AVA "" ; крхтакшкя+N:кърхтакшкя N_VAL1MIA "" ; @@ -2748,7 +2748,7 @@ LEXICON N_mdf2x кстиндафнема+N:къстиндафнема N_AVA "" ; ксты+N:ксты N_ANDY "mansikka" ; кстыкс+N:кстыкс N_OSH "mansikka" ; -кстыпанчф+N:кстыпанчф N_KAL "puna-apila" ; +кстыпанчф+N:ксты#панчф N_KAL "puna-apila" ; ксьмярдема+N:късьмярдема N_AVA "" ; ксяль+N:ксяль N_KIAL1 "kiisseli" ; ктмакс+N:кътмакс N_OSH "" ; @@ -2950,7 +2950,7 @@ LEXICON N_mdf2x кяйпаньджф+N:кяйпаньджф N_KAL "" ; кялема+N:кялема N_AVA "meno" ; кяль+N:кяль N_KIAL1 "kieli" ; -кяльгопанчф+N:кяльгопанчф N_KAL "martokukka" ; +кяльгопанчф+N:кяльго#панчф N_KAL "martokukka" ; кяльготнема+N:кяльготнема N_AVA "vale" ; кялькнема+N:кялькнема N_AVA "vale" ; кяме+N:кям%{ЕО%} N_SEL1ME "saapas" ; @@ -3349,7 +3349,7 @@ LEXICON N_mdf2x май+N:май N_VAJ "toukokuu" ; мак+N:мак N_KAL "" ; макет+N:макет N_KAL "" ; -макпанчф+N:макпанчф N_KAL "unikko" ; +макпанчф+N:мак#панчф N_KAL "unikko" ; макпря+N:макпря N_AVA "unikon siemenkota" ; макса+N:макс%{АО%} N_PULA "maksa" ; максака+N:максака N_AVA "hamsteri" ; @@ -5228,7 +5228,7 @@ LEXICON N_mdf2x розь+N:розь N_KIAL1 "ruis" ; розьвидьмот+N:розьвидьмот N_ "(mon.) rukiinjyvät" ; розьпакся+N:розьпакся N_AVA "ruispelto" ; -розьпанчф+N:розьпанчф N_KAL "ruiskaunokki" ; +розьпанчф+N:розь#панчф N_KAL "ruiskaunokki" ; рой+N:рой N_VAJ "mehiläisparvi" ; роль+N:роль N_KIAL1 "" ; ром+N:ром N_KAL "" ; @@ -5690,7 +5690,7 @@ LEXICON N_mdf2x сопротивления+N:сопротивления N_AVA "" ; сор+N:сор N_KAL "roska" ; сорга+N:сорга N_ "höyhen" ; -соргоняпанчф+N:соргоняпанчф N_KAL "kaunokainen" ; +соргоняпанчф+N:соргоня#панчф N_KAL "kaunokainen" ; соргопона+N:соргопона N_AVA "karvoitus" ; сортировка+N:сортировка N_AVA "lajittelija" ; сортише+N:сортише N_TISHE "rikkaruoho" ; @@ -7752,7 +7752,7 @@ LEXICON N_mdf2x эшаптома+N:эшаптома N_AVA "" ; эше+N:эше N_TISHE "viileys" ; эшеляма+N:эшеляма N_AVA "uinti" ; -эши+N:эши N_AVA "kaivo" ; +эши+N:эши N_ANDY "kaivo" ; эшкс+N:эшкс N_OSH "varjo" ; юбка+N:юбка N_AVA "hame" ; юв+N:юв N_KAL "akana" ; diff --git a/src/fst/stems/N_mdf2x.xml b/src/fst/stems/N_mdf2x.xml index 55a8a0a3..bdc4c083 100644 --- a/src/fst/stems/N_mdf2x.xml +++ b/src/fst/stems/N_mdf2x.xml @@ -57931,7 +57931,7 @@ крхкалма - кърхкалма + кърхкалм%{АО%} kərxkalma @@ -58661,7 +58661,7 @@ кстыпанчф - кстыпанчф + ксты#панчф kstipańčf @@ -60275,7 +60275,7 @@ кукшення панчф - кукшення панчф + кукшення #панчф kukšəńńä pańčf кукшень @@ -64095,7 +64095,7 @@ кяльгопанчф - кяльгопанчф + кяльго#панчф käľgəpańčf @@ -65590,7 +65590,7 @@ лаймарькс панчф - лаймарькс панчф + лаймарькс #панчф lajmaŕks pańčf лаймарькс @@ -73034,7 +73034,7 @@ макпанчф - макпанчф + мак#панчф mak(ə)pańčf @@ -115491,7 +115491,7 @@ розьпанчф - розьпанчф + розь#панчф roźbańčf @@ -121595,7 +121595,7 @@ сенем пря панчф - сенем пря панчф + сенем #пря #панчф śeńəm bŕä pańčf сенем @@ -125950,7 +125950,7 @@ соргоняпанчф - соргоняпанчф + соргоня#панчф sorgəńäpańčf @@ -170610,7 +170610,7 @@ эши - эши + эши äši, jäši diff --git a/src/fst/stems/V_mdf2x.lexc b/src/fst/stems/V_mdf2x.lexc index d6a3a8b3..91635950 100644 --- a/src/fst/stems/V_mdf2x.lexc +++ b/src/fst/stems/V_mdf2x.lexc @@ -184,9 +184,9 @@ LEXICON V_mdf2x амолдавомс+V:амолдав IV_ANDOVOMS "tulla ammennetuksi" ; амолдамс+V:амолда IV_KUNDAMS "ammentaa" ; амолдафнемс+V:амолдафне BV_KUNDAMS "ammennuttaa" ; -амолякшнемс+V:амолякшне IV_KUNDAMS "ammennella" ; -амолямс+V:амоля IV_KUNDAMS "ammennella" ; -амоляфнекшнемс+V:амоляфнекшне IV_KUNDAMS "ammennutella" ; +амолякшнемс+V:амолякшне BV_KUNDAMS "ammennella" ; +амолямс+V:амоля BV_KUNDAMS "ammennella" ; +амоляфнекшнемс+V:амоляфнекшне BV_KUNDAMS "ammennutella" ; амоляфнемс+V:амоляфне BV_KUNDAMS "ammennuttaa" ; амоляфтомс+V:амоляфт BV_ALYJAFTOMS "ammennuttaa" ; амсемс+V:амсе IV_KUNDAMS "syöskennellä (lastenkielessä)" ; @@ -2747,7 +2747,7 @@ LEXICON V_mdf2x кеворькшнемс+V:кеворькшне IV_KUNDAMS "kieriskellä" ; кеворьфтемс+V:кеворьфть BV_NJAFTEMS "kierittää" ; кеворьшнемс+V:кеворьшне IV_KUNDAMS "kieriskellä" ; -кеворямс+V:кеворя IV_KUNDAMS "kieriskellä" ; +кеворямс+V:кеворя BV_KUNDAMS "kieriskellä" ; кеворяфнемс+V:кеворяфне BV_KUNDAMS "kieritellä" ; кеворяфтомс+V:кеворяфт BV_ALYJAFTOMS "kieritellä" ; кевярькшнемс+V:кевярькшне IV_KUNDAMS "vetelehtiä" ; diff --git a/src/fst/stems/V_mdf2x.xml b/src/fst/stems/V_mdf2x.xml index c54c7359..a45b7303 100644 --- a/src/fst/stems/V_mdf2x.xml +++ b/src/fst/stems/V_mdf2x.xml @@ -3916,9 +3916,9 @@ - амолякшнемс + амолякшнемс - амолякшне + амолякшне амолямс @@ -3938,9 +3938,9 @@ - амолямс + амолямс - амоля + амоля aməľams @@ -3956,9 +3956,9 @@ - амоляфнекшнемс + амоляфнекшнемс - амоляфнекшне + амоляфнекшне амоляфнемс @@ -57127,9 +57127,9 @@ - кеворямс + кеворямс - кеворя + кеворя diff --git a/src/fst/stems/exceptions.lexc b/src/fst/stems/exceptions.lexc index 4e05f2ac..26106fdd 100644 --- a/src/fst/stems/exceptions.lexc +++ b/src/fst/stems/exceptions.lexc @@ -5649,15 +5649,19 @@ cамс+V+Ind+Prs+ScSg2:саят K ; правондафневомс+V:правондафнев IV_ANDOVOMS ; !! RUSSIAN VERBS +действовать+V+Ind+Prs+ScSg3+Err/Lex+OLang/RUS:действует # ; зависить+V+Ind+Prs+ScPl3+Err/Lex+OLang/RUS:зависят # ; зависить+V+Ind+Prs+ScSg3+Err/Lex+OLang/RUS:зависит # ; +использоваться+V+Ind+Prs+ScSg3+Err/Lex+OLang/RUS:используется # ; обработать+V+Inf+Err/Lex+OLang/RUS:обработать # ; отличаться+V+Ind+Prs+ScPl3+Err/Lex+OLang/RUS:отличаются # ; очистить+V+Inf+Err/Lex+OLang/RUS:очистить # ; очищать+V+Ind+Prs+ScPl3+Err/Lex+OLang/RUS:очищают # ; очищать+V+Ind+Prs+ScSg3+Err/Lex+OLang/RUS:очищает # ; +очищаться+V+Ind+Prs+ScSg3+Err/Lex+OLang/RUS:очищается # ; привлекать+V+Ind+Prs+ScPl3+Err/Lex+OLang/RUS:привлекают # ; применяться+V+Ind+Prs+ScSg3+Err/Lex+OLang/RUS:применяется # ; +разрушаться+V+Ind+Prs+ScSg3+Err/Lex+OLang/RUS:разрушается # ; расширяться+V+Ind+Prs+ScSg3+Err/Lex+OLang/RUS:расширяется # ; сжиматься+V+Ind+Prs+ScSg3+Err/Lex+OLang/RUS:сжимается # ; сжиматься+V+Ind+Prs+ScPl3+Err/Lex+OLang/RUS:сжимаются # ; diff --git a/src/fst/stems/nouns_newwords.lexc b/src/fst/stems/nouns_newwords.lexc index 2cc41ae6..65d874f8 100644 --- a/src/fst/stems/nouns_newwords.lexc +++ b/src/fst/stems/nouns_newwords.lexc @@ -1336,4 +1336,6 @@ LEXICON N_NEWWORDS казямши+N:казям#ши N_AVA ; аноксши+N:анокс#ши N_AVA ; ёнюши+N:ёню#ши N_AVA ; - \ No newline at end of file +кардон+N:кардон N_KAL ; +килограмм+N:килограмм N_KAL ; + diff --git a/src/fst/stems/verbs_newwords.lexc b/src/fst/stems/verbs_newwords.lexc index b42c8a7a..30a60bae 100644 --- a/src/fst/stems/verbs_newwords.lexc +++ b/src/fst/stems/verbs_newwords.lexc @@ -132,7 +132,8 @@ test:test N_KAL "(eng) /(fin) /(rus) " ; явштамс+V:явшта BV_KUNDAMS ; вельмамс+V:вельма IV_KUNDAMS ; вельмафтомс+V:вельмафт BV_ALYJAFTOMS ; - +кодсемс+V:кодсе BV_KUNDAMS ; +кярсемс+V:кярсе BV_KUNDAMS ; аноклакшемс+V+Err/Dial:аноклакше BV_KUNDAMS ; арелякшемс+V+Err/Dial:арелякше BV_KUNDAMS ;