Skip to content

Commit

Permalink
New adjectives and nouns, propernouns
Browse files Browse the repository at this point in the history
  • Loading branch information
rueter committed Oct 30, 2023
1 parent 85e7ad3 commit 810c77d
Show file tree
Hide file tree
Showing 6 changed files with 212 additions and 9 deletions.
2 changes: 1 addition & 1 deletion src/fst/affixes/numerals.lexc
Original file line number Diff line number Diff line change
Expand Up @@ -3,7 +3,7 @@
!LEXICON NUM_ !!= * @CODE@ Lacks specific continuation lexicon
!+Num+WORK: #;

LEXICON NUM-SG_NOM_
LEXICON NUM_SG_NOM
+Sg+Nom: # ;

LEXICON NUM_SADA_SG_OBL
Expand Down
65 changes: 65 additions & 0 deletions src/fst/stems/adjectives_newwords.lexc
Original file line number Diff line number Diff line change
Expand Up @@ -564,6 +564,66 @@ tiinõq+A:tiinõ A_11AINWQ "_ˋtiinõ, tiinõt__tiinõq_" ;
!kokoś+A:ko%{kg%}oś A_12 "_#gosõ, #gost__ko|koś_" ;
!vihhas+A:vi%{hØ%}has A_12 "_#vihadsõ, #st__vihhas_" ;
põhilinõ+A:põhili A_13ALONW ;
haruldanõ+A:harulda A_13ALONW ;
liivanõ+A:liiva A_13ALONW ;
mitmõsugunõ+A:mitmõsugu A_13ALONW ;
õhokõnõ+A:õhokõ A_13ALONW ;
vastanõ+A:vasta A_13ALONW ;
tsihilinõ+A:tsihili A_13ALONW ;
maa-alonõ+A:maa-alo A_13ALONW ;
ijästüpoolinõ+A:ijästüpooli A_13ALONW ;
kaulinõ+A:kauli A_13ALONW ;
vihukõnõ+A:vihukõ A_13ALONW ;
säänesamanõ+A:säänesama A_13ALONW ;
säitsmeaastaganõ+A:säitsmeaastaga A_13ALONW ;
riiklinõ+A:riikli A_13ALONW ;
rehealunõ+A:rehealu A_13ALONW ;
punanõ+A:puna A_13ALONW ;
meretagonõ+A:meretago A_13ALONW ;
maruvihanõ+A:maruviha A_13ALONW ;
köberlikanõ+A:köberlika A_13ALONW ;
kunadanõ+A:kunada A_13ALONW ;
kolmõaastaganõ+A:kolmõaastaga A_13ALONW ;
kodonõ+A:kodo A_13ALONW ;
jontlikanõ+A:jontlika A_13ALONW ;
helle-punanõ+A:helle-puna A_13ALONW ;
varajanõ+A:varaja A_13ALONW ;
śoosinanõ+A:śoosina A_13ALONW ;
ütśainukõnõ+A:ütśainukõ A_13ALONW ;
ütsäaastaganõ+A:ütsäaastaga A_13ALONW ;
ütetasanõ+A:ütetasa A_13ALONW ;
üteaastaganõ+A:üteaastaga A_13ALONW ;
üleriiklinõ+A:üleriikli A_13ALONW ;
ülemainõ+A:ülemai A_13ALONW ;
võõramainõ+A:võõramai A_13ALONW ;
võrdharonõ+A:võrdharo A_13ALONW ;
võetavanõ+A:võetava A_13ALONW ;
valdkundõvaihõlinõ+A:valdkundõvaihõli A_13ALONW ;
uudishimolinõ+A:uudishimoli A_13ALONW ;
tśombonõ+A:tśombo A_13ALONW ;
tsilgakujolinõ+A:tsilgakujoli A_13ALONW ;
tagaminõ+A:tagami A_13ALONW ;
sõralinõ+A:sõrali A_13ALONW ;
säsüsarnanõ+A:säsüsarna A_13ALONW ;
sinikasrohilinõ+A:sinikasrohili A_13ALONW ;
siilolinõ+A:siiloli A_13ALONW ;
saravoalonõ+A:saravoalo A_13ALONW ;
salahinõ+A:salahi A_13ALONW ;
rõngasugunõ+A:rõngasugu A_13ALONW ;
rohikaskõllanõ+A:rohikaskõlla A_13ALONW ;
põrmandualonõ+A:põrmandualo A_13ALONW ;
poolõaastaganõ+A:poolõaastaga A_13ALONW ;
olulinõ+A:oluli A_13ALONW ;
ohkõnõ+A:ohkõ A_13ALONW ;
monoteistlinõ+A:monoteistli A_13ALONW ;
mitmõsugumanõ+A:mitmõsuguma A_13ALONW ;
mitmõaastaganõ+A:mitmõaastaga A_13ALONW ;
madalapoolinõ+A:madalapooli A_13ALONW ;
lodõhanõ+A:lodõha A_13ALONW ;
leeväsugumanõ+A:leeväsuguma A_13ALONW ;
laplikanõ+A:laplika A_13ALONW ;
laidliganõ+A:laidliga A_13ALONW ;

anatoomilinõ+A:anatoomili A_13ALONW ;
aritmeetilinõ+A:aritmeetili A_13ALONW ;
arktilinõ+A:arktili A_13ALONW ;
Expand Down Expand Up @@ -1597,6 +1657,11 @@ edimäne+A:edimä A_19PEDAEJAENE "_#dse, #st__edimä|ne_" ;
eeläskine+A:eeläski A_19PEDAEJAENE "_#dse, #st__eeläski|ne_" ;
eestiaolinõ+A:eesti#aoli A_19ALOMANW "_#dsõ, #st__eesti%{ˋØ%}aoli|nõ_" ;
egäsugumanõ+A:egäsuguma A_19ALOMANW "_#dsõ, #st__egäsuguma|nõ_" ;
egäsugumanõ+A+Err/Orth:egasuguma A_19ALOMANW ;
õgasugumanõ+A:õgasuguma A_19ALOMANW ;
mitmõsugumanõ+v1+A:mitmõsuguma A_19ALOMANW ;
mitmõsugumanõ+v2+A:mitmasuguma A_19ALOMANW ;

elolinõ+A:eloli A_19ALOMANW "_#dsõ, #st__eloli|nõ_" ;
eräsline+A:eräsli A_19PEDAEJAENE "_#dse, #st__eräsli|ne_" ;
esiqeräline+A:esiqeräli A_19PEDAEJAENE "_#dse, #st __esiqeräli|ne_" ;
Expand Down
100 changes: 100 additions & 0 deletions src/fst/stems/nouns_newwords.lexc
Original file line number Diff line number Diff line change
Expand Up @@ -5923,6 +5923,16 @@ vahtsõndus+N:vahtsõndus N_18AIVASTUS "_#õ, #t__vahtsõndus_" ;
vaihõlus+N:vaihõlus N_18AIVASTUS "_#õ, #t__vaihõlus_" ;
vaiõlus+N:vaiõlus N_18AIVASTUS "_#õ, #t__vaiõlus_" ;
valitsus+N:valitsus N_18AIVASTUS "_#õ, #t__valitsus_" ;
keskvaĺtsus+N:keskvaĺtsus N_18AIVASTUS ;
vaĺtsus+N:vaĺtsus N_18AIVASTUS ;
vallavaĺtsus+N:vallavaĺtsus N_18AIVASTUS ;
umavaĺtsus+N:umavaĺtsus N_18AIVASTUS ;
riigivaĺtsus+N:riigivaĺtsus N_18AIVASTUS ;
pupivaĺtsus+N:pupivaĺtsus N_18AIVASTUS ;
liinavaĺtsus+N:liinavaĺtsus N_18AIVASTUS ;
aadliumavaĺtsus+N:aadliumavaĺtsus N_18AIVASTUS ;
koolivaĺtsus+N:koolivaĺtsus N_18AIVASTUS ;

vallatus+N:vallatus N_18AIVASTUS "_#õ, #t__vallatus_" ;
vanahus+N:vanahus N_18AIVASTUS "_#õ, #t__vanahus_" ;
vanatihkus+N:vana%{ˋØ%}tihkus N_18AIVASTUS "_#õ, vanna%{ˋØ%}tihkust__vana%{ˋØ%}tihkus_" ;
Expand Down Expand Up @@ -6005,6 +6015,22 @@ väärüs+N:väärüs N_18EHITUES "_#e, #t__väärüs_" ;
vöörüs+N:vöörüs N_18EHITUES "_#e, #t__vöörüs_" ;
vüürüs+N:vü̬ü̬rüs N_18EHITUES "_#e, #t__vü̬ü̬rüs_" ;
õiõndus+N:õiõndus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
rahandus+N:rahandus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
asundus+N:asundus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
vastandus+N:vastandus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
lahendus+N:lahendus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
kipõndus+N:kipõndus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
mõtsandus+N:mõtsandus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
virgõndus+N:virgõndus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
turismindus+N:turismindus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
söögiaśandus+N:söögiaśandus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
sisaldus+N:sisaldus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
saladus+N:saladus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
rakõndus+N:rakõndus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
rahaaśandus+N:rahaaśandus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
raamadukujondus+N:raamadukujondus N_18AIVASTUS "_#õ, #t__õiõndus_" ;
puhkõmajandus+N:puhkõmajandus N_18AIVASTUS "_#õ, #t__õiõndus_" ;

õnnistus+N:õ̭nnistus N_18AIVASTUS "_#õ, #t__õ̭nnistus_" ;
õnnõtus+N:õ̭nnõtus N_18AIVASTUS "_#õ, #t__õ̭nnõtus_" ;
ämmärdüs+N:ämmärdüs N_18EHITUES "_#e, #t__ämmärdüs_" ;
Expand Down Expand Up @@ -6380,6 +6406,57 @@ voonakõnõ+N:voonakõ N_22VWROKWNW "_#sõ, #ist__voonakõ|nõ_" ;
võrokõnõ+N:võrokõ N_22VWROKWNW "_#sõ, #ist__võrokõ|nõ_" ;
vähäkene+N:vähäke N_22VAEHAEKENE "_#se, #ist__vähäke|ne_" ;
õhvakõnõ+N:õhvakõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
neiokõnõ+N:neiokõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
poisikõnõ+N:poisikõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
latsikõnõ+N:latsikõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
sillukõnõ+N:sillukõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
õhokõnõ+N:õhokõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
väikokõnõ+N:väikokõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
ujakõnõ+N:ujakõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
tilgakõnõ+N:tilgakõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
rasvaosakõnõ+N:rasvaosakõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
raamadukõnõ+N:raamadukõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
pulgakõnõ+N:pulgakõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
paigakõnõ+N:paigakõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
norrakõnõ+N:norrakõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
muĺokõnõ+N:muĺokõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
majakõnõ+N:majakõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
lõigukõnõ+N:lõigukõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
kunnapojakõnõ+N:kunnapojakõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
kujokõnõ+N:kujokõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
kotikõnõ+N:kotikõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
komakõnõ+N:komakõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
kaonukõnõ+N:kaonukõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
jalakõnõ+N:jalakõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
ainokõnõ+N:ainokõ N_22VWROKWNW "_#sõ, #ist__õhvakõ|nõ_" ;
tükükene+N:tüküke N_22VAEHAEKENE ;
peenikene+N:peenike N_22VAEHAEKENE ;
järvesilmäkene+N:järvesilmäke N_22VAEHAEKENE ;
veretäpikene+N:veretäpike N_22VAEHAEKENE ;
vellekene+N:velleke N_22VAEHAEKENE ;
urvatissekene+N:urvatisseke N_22VAEHAEKENE ;
täpikene+N:täpike N_22VAEHAEKENE ;
tsihikene+N:tsihike N_22VAEHAEKENE ;
tissekene+N:tisseke N_22VAEHAEKENE ;
tihikene+N:tihike N_22VAEHAEKENE ;
ristikene+N:ristike N_22VAEHAEKENE ;
riigikene+N:riigike N_22VAEHAEKENE ;
pööräkene+N:pööräke N_22VAEHAEKENE ;
pähklikene+N:pähklike N_22VAEHAEKENE ;
pindrekene+N:pindreke N_22VAEHAEKENE ;
pappikene+N:pappike N_22VAEHAEKENE ;
nöörikene+N:nöörike N_22VAEHAEKENE ;
liikmekene+N:liikmeke N_22VAEHAEKENE ;
lehekene+N:leheke N_22VAEHAEKENE ;
küläkene+N:küläke N_22VAEHAEKENE ;
kivikene+N:kivike N_22VAEHAEKENE ;
esäkene+N:esäke N_22VAEHAEKENE ;
eläjäkene+N:eläjäke N_22VAEHAEKENE ;
tuvikene+N:tuvike N_22VAEHAEKENE ;
soolõkepikene+N:soolõkepike N_22VAEHAEKENE ;
setukene+N:setuke N_22VAEHAEKENE ;
lumõtükükene+N:lumõtüküke N_22VAEHAEKENE ;
jutukene+N:jutuke N_22VAEHAEKENE ;

abinaanõ+N:abi#naa N_22NAANW "_#asõ, #ist__abina|anõ_" ;
hannanaanõ+N:hanna#naa N_22NAANW "_#asõ, #ist__hannana|anõ_" ;
Expand Down Expand Up @@ -7595,6 +7672,13 @@ aprikuuś+N:aprik%{ou%}%{ou%}%{sś%} N_38PUUM1 "_#koosi, #ku̬u̬si__apri|ku̬u
apõĺsiiń+N:apõĺsii%{nń%} N_38PULL1 "_#siini, #%{ˋØ%}siini__apõĺ|siiń_" ;
arbuuś+N:arbuu%{sś%} N_38PULL1 "_#buusi, #%{ˋØ%}buusi__ar|buuś_" ;
arkeoluuǵ+N:arkeol%{ou%}%{ou%}%{gǵ%} N_38PUUM1 "_#loogi, #lu̬u̬gi__arkeo|lu̬u̬ǵ_" ;
sotsioluuǵ+N:sotsiol%{ou%}%{ou%}%{gǵ%} N_38PUUM1 "_#loogi, #lu̬u̬gi__arkeo|lu̬u̬ǵ_" ;
teoluuǵ+N:teol%{ou%}%{ou%}%{gǵ%} N_38PUUM1 "_#loogi, #lu̬u̬gi__arkeo|lu̬u̬ǵ_" ;
teedüstehnoluuǵ+N:teedüstehnol%{ou%}%{ou%}%{gǵ%} N_38PUUM1 "_#loogi, #lu̬u̬gi__arkeo|lu̬u̬ǵ_" ;
ornitoluuǵ+N:ornitol%{ou%}%{ou%}%{gǵ%} N_38PUUM1 "_#loogi, #lu̬u̬gi__arkeo|lu̬u̬ǵ_" ;
füsioluuǵ+N:füsiol%{ou%}%{ou%}%{gǵ%} N_38PUUM1 "_#loogi, #lu̬u̬gi__arkeo|lu̬u̬ǵ_" ;
astroluuǵ+N:astrol%{ou%}%{ou%}%{gǵ%} N_38PUUM1 "_#loogi, #lu̬u̬gi__arkeo|lu̬u̬ǵ_" ;

arḿ+N:ar%{mḿ%} N_38PULL1 "_armi, %{ˋØ%}armi __arḿ_" ;
armpant́+N:armpan%{tt́d%} N_38PAPP1 "_#pandi, #%{ˋØ%}panti__arm|pant́_" ;
arst́+N:ars%{tt́%} N_38PULL1 "_arsti, %{ˋØ%}arsti__arst́_" ;
Expand Down Expand Up @@ -9442,6 +9526,22 @@ kilu+N:ki%{lØ%}lu N_40TALO "_#u, #lu__kil|u_" ;
kirätśura+N:kirätśu%{rØ%}ra N_40UJA "_#a, #ra__kirätśur|a_" ;
kodo+N:ko%{td%}o N_40TALO "_#do, #to, kodo, koto(h)n, kotost__ko|do_" ;
kogo+N:ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;

nõvvokogo+N:nõvvo#ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;
täütevnõvvokogo+N:täütev#nõvvo#ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;
luulõtuisikogo+N:luulõtuisi#ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;
külänõvvukogo+N:külänõvvu#ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;
velitsidekogo+N:velitside#ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;
vanõmbidõkogo+N:vanõmbidõ#ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;
valikkogo+N:valik#ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;
tekstiilikogo+N:tekstiili#ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;
siseviikogo+N:sisevii#ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;
raamatokogo+N:raamato#ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;
novellikogo+N:novelli#ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;
luulekogo+N:luule#ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;
edendüsnõvvokogo+N:edendüsnõvvo#ko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;
aforismikogo+N:aforismiko%{kg%}o N_40TALO "_#go, #ko__ko|go_" ;

nuurivolikogo+N:nu̬u̬ri#voli#ko%{kg%}o N_40TALO ;
koho+N:ko%{hØ%}ho N_40TALO "_#o, #ho__koh|o_" ;
kokkohelü+N:kokkohe%{lØ%}lü N_40HELUE "_#ü, #lü__kokkohel|ü_" ;
Expand Down
2 changes: 1 addition & 1 deletion src/fst/stems/numerals.lexc
Original file line number Diff line number Diff line change
Expand Up @@ -13,7 +13,7 @@ tõõnõ+v1+Num:tõõ NUM_22NAANW "" ;
tõõnõ+v2+Num:tõ̭ NUM_22VWROKWNW "" ;
katś+Num:kat NUM_36KATS1 "" ;
kolm+v1+Num:kolm NUM_36KOKR "" ;
kolm+v2+Num:kolq NUM-SG_NOM_ "" ;
kolm+v2+Num:kolq NUM_SG_NOM "" ;
katsandik+Num:%{ˋØ%}#katsandi%{kg%} NUM_43KANARIK "" ;
katõndik+Num:katõndi%{kg%} NUM_43KANARIK "" ;
kolmandik+Num:kolmandi%{kg%} NUM_43KANARIK "" ;
Expand Down
2 changes: 1 addition & 1 deletion src/fst/stems/numerals.xml
Original file line number Diff line number Diff line change
Expand Up @@ -103,7 +103,7 @@
<e><lg><l pos="Num">katś</l><stg><st Contlex="NUM_36KATS1">kat</st></stg><mini_paradigm><analysis msd="Num"><wordform>#õ, #tõ</wordform></analysis><analysis msd="Num"><wordform>katś</wordform></analysis></mini_paradigm></lg><mg relId="0"><defNative/></mg></e>
<e><lg><l pos="Num">kolm</l><stg>
<st Contlex="NUM_36KOKR" varid="1">kolm</st>
<st Contlex="NUM-SG-NOM_" varid="2">kolq</st>
<st Contlex="NUM_SG_NOM" varid="2">kolq</st>
</stg><mini_paradigm><analysis msd="Num"><wordform>kolmõ, %{ˋØ%}kolmõ </wordform></analysis><analysis msd="Num"><wordform>kolm</wordform></analysis></mini_paradigm></lg><mg relId="0"><defNative/></mg></e>
<e><lg><l pos="Num">katsandik</l><stg><st Contlex="NUM_43KANARIK">%{ˋØ%}#katsandi%{kg%}</st></stg><mini_paradigm><analysis msd="Num"><wordform>#gu, #kku</wordform></analysis><analysis msd="Num"><wordform>ˋkatsandik</wordform></analysis></mini_paradigm></lg><mg relId="0"><defNative/></mg></e>
<e><lg><l pos="Num">katõndik</l><stg><st Contlex="NUM_43KANARIK">katõndi%{kg%}</st></stg><mini_paradigm><analysis msd="Num"><wordform>#gu, #kku</wordform></analysis><analysis msd="Num"><wordform>katõndik</wordform></analysis></mini_paradigm></lg><mg relId="0"><defNative/></mg></e>
Expand Down
Loading

0 comments on commit 810c77d

Please sign in to comment.