-
Notifications
You must be signed in to change notification settings - Fork 1
/
index.html
113 lines (113 loc) · 6.55 KB
/
index.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
<h2><a name="Achoimre">Achoimre</a></h2>
<p>
Seo é leathanach baile <i>Líonra Séimeantach na Gaeilge</i>
(“LSG” mar ghiorrúchán, nó, as Béarla,
<i>The Irish Language Semantic Network</i>), bunachar sonraí ina bhfuil
focail Ghaeilge agus gaolta séimeantacha eatarthu.
Uaireanta tugtar <i>wordnet</i> ar líonra séimeantach den chineál seo,
ainmnithe as an
<a target="_blank" href="https://wordnet.princeton.edu/">WordNet Béarla</a>
a forbraíodh sna 1980í in Ollscoil Princeton, S.A.M.
Ba é sin an chéad líonra séimeantach cuimsitheach i dteanga ar bith.
Tabhair faoi deara go bhfuil líonra séimeantach
i bhfad níos saibhre ná “teasáras” traidisiúnta ina bhfuil
focail chomhchiallacha agus, b'fhéidir, focail fhrithchiallacha.
Ach tá gaolta níos saibhre ar fáil i LSG (agus
i líonraí séimeantacha eile), mar shampla
<i>hipearainmneacha</i> agus <i>hiopainmneacha</i>
(téarmaí níos leithne/níos cúinge) <i>míorainmneacha</i> agus
<i>holainmneacha</i> (páirt vs. iomlán), srl.
</p>
<p>
<a href="lsg-best.png"><img class="ardheis" width="184" height="184" src="lsg-thumb.png"/></a>
Is féidir líonraí séimeantacha a úsáid i raon leathan feidhmchlár
a bhaineann le Próiseáil Teangacha Nádúrtha.
Úsáidtear iad i gcórais imdhealaithe athbhríochta,
achoimriú agus innéacsú de cháipéisí, agus aisfháil faisnéise.
Nuair atá na focail i líonra áirithe nasctha le focail
i dteanga eile (nascanna le Béarla atá i LSG),
is féidir an líonra a úsáid chun
córas ríomhaistriúcháin a fheabhsú.
Go ginearálta, ó dhearcadh na hintleachta saorga,
stórálann líonra séimeantach roinnt eolais faoin saol mór
atá de dhíth ar ríomhairí chun téacsanna a thuiscint agus
a phróiseáil ar bhealach fiúntach.
</p>
<p>
Ar an taobh deas den leathanach seo, feicfidh tú íomhá bheag den líonra
ina iomláine (cliceáil chun leagan lánmhéide a fheiceáil).
Mar a tharlaíonn, íomhá shimplithe atá ann — seasann gach nód san íomhá do chnuasach d'fhocail
chomhchiallacha ab fhéidir cur leis an íomhá mar chraobhacha breise.
Rud éigin cosúil leis an líonra seo, ach níos mó agus níos casta faoi mhílte is dócha,
atá neadaithe in inchinn gach cainteora Gaeilge — déantar nascanna
séimeantacha den chineál seo go hinstinneach agus ar bhuille boise.
Leis an mbrabhsálaí tríthoiseach, is féidir leat “eitilt” tríd an
líonra agus é a láimhseáil ar bhealaí éagsúla.
</p>
<hr>
<h2><a name="Download">Íoslódáil</a></h2>
<p>
<a href="ooo.png"><img class="ardheis" width="233" height="163" src="ooo.png"/></a>
Fiú mura bhfuil suim agat i mbogearraí a dhéanann próiseáil
ar theangacha nádúrtha, seans go mbainfidh tú úsáid
as an mbunachar sonraí mar sin féin,
agus dá bhrí seo tugaim rochtain air ar bhealaí éagsúla:
</p>
<ul>
<li>Mar theasáras saibhrithe, i bhfoirm PDF. Tabhair faoi deara
go bhfuil <em>gach focal</em> sa teasáras ina chrostagairt hipearnaisc.
Is féidir an comhad
<a target="_blank" href="https://kevinscannell.com/files/lsg-1.001.pdf" hreflang="ga">PDF</a> (beagnach 50MB!) a íoslódáil
go díreach, is é sin nó
<a target="_blank" href="lsg-latex-1.001.tar.gz">na foinsí LaTeX</a> a fháil más mian leat an
PDF a thógáil duit féin (mar shampla le clófhoirne eile).
Ba chóir duit an comhad a shábháil go logánta ar do ríomhaire chun
bandaleithead a choigilt.</li>
<li>Mar chuid de na feidhmchláir
<a target="_blank" href="https://ga.libreoffice.org/">LibreOffice</a> nó
<a target="_blank" href="https://www.openoffice.org/ga/">OpenOffice.org</a>.
Suiteáiltear an teasáras sa dá fheidhmchlár seo mar chuid de bhreiseán
a thagann i bpacáiste amháin in éindí leis
<a href="/gaelspell/">an litreoir GaelSpell</a> agus
<a href="/fleiscin/">rialacha a bhaineann le fleiscíní</a> i nGaeilge.
Gheobhaidh tú an breiseán agus na treoracha suiteála d'OpenOffice.org
<a target="_blank" href="https://extensions.openoffice.org/en/project/irish-language-spell-checker-thesaurus-and-hyphenation-patterns">anseo</a>
agus an breiseán do LibreOffice
<a target="_blank" href="https://extensions.libreoffice.org/en/extensions/show/irish-language-spell-checker-thesaurus-and-hyphenation-patterns">anseo</a>.
Feicfidh tú pictiúr den teasáras ar obair in OpenOffice.org
ar dheis (cliceáil chun leagan lánmhéide a fheiceáil).</li>
<li>An bunachar sonraí iomlán, easpórtáilte mar chomhad XML i bhformáid LMF (Lexical Markup Framework), formáid inphróiseáilte is féidir a úsáid i mbogearraí eile. Tá an comhad seo, chomh maith leis an gcód go léir a bhaineann leis an tionscadal, ar fáil ón
<a target="_blank" href="https://github.com/kscanne/wordnet-gaeilge/releases">suíomh forbartha</a> ar GitHub (is é <i>lsg-lmf.zip</i> an comhad le híoslódáil).</li>
</ul>
<hr>
<h2><a name="Features">Sainghnéithe</a></h2>
<ul>
<li><b>Bunachar sonraí cuimsitheach</b>. Tá 32742 bunchiall,
36262 ceannfhocal agus
77596 ciall ar leith ann, le téarmaíocht chomhaimseartha,
focail liteartha, focail chanúnacha, béarlagair, srl. san áireamh.</li>
<li><b>Saorcheadúnas</b>. Cosúil le WordNet Princeton
(ach, faraor, neamhchosúil leis
<a target="_blank" href="http://globalwordnet.org/resources/wordnets-in-the-world/">
an gcuid is mó de líonraí séimeantacha eile</a>), is bogearra oscailte é LSG.
Go sonrach, tá na sonraí go léir, an teasáras PDF san áireamh, ar fáil
de réir coinníollacha an
<a target="_blank" href="https://www.gnu.org/licenses/fdl-1.3.html">GNU Free Documentation License</a>. Tugann an ceadúnas seo <b>saoirse</b> duit — saoirse na sonraí
a chóipeáil nó a dháileadh, athraithe nó gan athrú, chomh fada is
a dháileann tú iad faoin cheadúnas céanna.</li>
<li><b>Nascanna le Béarla</b>. Tá gach iontráil i LSG nasctha le cnuasach
d'fhocail chomhchiallacha (“synset”) i WordNet Princeton.
Is cuid thábhachtach é seo de mo chuid oibre ar ríomhaistriúchán
idir Béarla agus An Ghaeilge, tionscadal atá idir lámha fós.</li>
<li><b>Nuashonraithe go minic</b>. Déanfaidh mé nuashonrú ar
an líonra go rialta agus nuair a bheidh ceartúcháin agus feabhsúcháin
le déanamh.
Sa chaoi seo, is féidir cumhacht na Gaeilge mar theanga bheo a
thaispeáint, trí théarmaíocht agus frásaí nua a chur leis.</li>
<li><b>Foclóir comhroinnte</b>. Úsáidim bunachar sonraí amháin chun
LSG, litreoirí <a href="/gaelspell/">GaelSpell</a>,
agus <a href="/gramadoir/">An Gramadóir</a> a chruthú.
Nuair a fheabhsaítear an foclóir i dtionscadal amháin, téann na
feabhsúcháin sin i bhfeidhm ar na tionscadail eile freisin,
go huathoibríoch.</li>
</ul>