From 33f112c4a8a424a684cb672f8688e433c1861402 Mon Sep 17 00:00:00 2001 From: sandraeiche7 Date: Thu, 7 Jan 2021 08:34:24 +0200 Subject: [PATCH] 11. praktikumi uuendus --- Praktikum11/Praktikum11.ipynb | 16 +- html/Praktikum_11.html | 26657 +++++++++++++++++--------------- 2 files changed, 13910 insertions(+), 12763 deletions(-) diff --git a/Praktikum11/Praktikum11.ipynb b/Praktikum11/Praktikum11.ipynb index 4978c8c..103392f 100644 --- a/Praktikum11/Praktikum11.ipynb +++ b/Praktikum11/Praktikum11.ipynb @@ -212,7 +212,7 @@ "name": "stderr", "output_type": "stream", "text": [ - "100%|█████████████████████████████████████████████████████████████████| 10000000/10000000 [00:04<00:00, 2144980.78it/s]\n" + "100%|█████████████████████████████████████████████████████████████████| 10000000/10000000 [00:08<00:00, 1231744.87it/s]\n" ] } ], @@ -319,7 +319,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "### Ülesanne 2. Isikute ja asukohtadega seotud informatsiooni ekstraheerimine tekstist (2p)" + "### Ülesanne 2. Isikute ja asukohtadega seotud informatsiooni ekstraheerimine tekstist (2,5p)" ] }, { @@ -359,7 +359,9 @@ " \n", "* kui tuvastatud osalauses leidub ka pärisnimele viitavaid nimega üksusi (PER), siis tuleks kontrollida, kas vähemalt mõnel neist on midagi ühist failinimes oleva kunstniku nimega (ees- või perekonnanimi - võime oletada, et kui Aado Vabbe failis räägitakse Aadost, siis on tegu ikka selle sama kunstnikuga, aga kui Viiraltist, siis ilmselt mitte). Kui tundub, et osalause räägib ainult mõnest teisest isikust, siis ärme sellest osalausest leitud asukohale ja/või kunstistiilidele tähelepanu pööra.\n", "* kui tuvastatud osalauses pärisnimele viitavaid üksusi üldse ei leidu, siis omistame leitud asukohad ja kunstivoolud kunstnikule, kelle nime leiame faili nimest\n", - "* väljundiks peaks olema kaks json-formaadis faili - üks sisaldab iga kunstniku asukohti, teine iga kunstniku viljeldud kunstistiile. Kunstnike nimed on sellisel kujul nagu failinimedes." + "* väljundiks peaks olema kaks json-formaadis faili - üks sisaldab iga kunstniku asukohti, teine iga kunstniku viljeldud kunstistiile. Kunstnike nimed on sellisel kujul nagu failinimedes.\n", + "\n", + "**NB2! Nimeolemite eraldamisel tuleb siingi arvestada, et töö võib olla ajamahukas**" ] }, { @@ -1005,7 +1007,7 @@ "source": [ "Märgendatavale kihile lisage ka atribuut, mis sisaldab järjendit normaliseeritud fraasist: viige leitud fraasid kujule \"suur õun\" e omadussõna, millele järgneb nimisõna. Kui leidub mitu omadussõna, tehke igast eraldi fraas (\"suur ja sinine õun\" -> [\"suur õun\", \"sinine õun\"]), kusjuures fraas peaks olema algvormis. Mitmeste analüüside puhul jälgige, et algvorm oleks korrektne (\"tehtud töö\", mitte \"tegema töö\").\n", "\n", - "**0,5 boonuspunkti** saab teenida fraaside täpsema filtreerimisega. Uuri väljundist, milliseid ebatäpsusi näed (alustuseks nt laused *Olen Tartu **esindustest ostnud** probleemivabalt* või *Õnneks sai mul üks **tuttav garantiiga** aidata*) ning paranda taggerit nii, et see likvideeriks mõne vigadest (kirjelda, milliseid vigu parandasid)." + "**0,5 boonuspunkti** saab teenida fraaside täpsema filtreerimisega. Uuri väljundist, milliseid ebatäpsusi näed ning paranda taggerit nii, et see likvideeriks mõne vigadest (kirjelda, milliseid vigu parandasid). Vihje: alustuseks võiks mõelda näiteks, mis on (süsteemselt) valesti lausetes *Olen Tartu **esindustest ostnud** probleemivabalt* või *Õnneks sai mul üks **tuttav garantiiga** aidata*." ] }, { @@ -1153,7 +1155,7 @@ "\tstart: ADJECTIVE_CHAIN\n", "\tterminals: J, MSEQ(A), MSEQ(C)\n", "\tnonterminals: ADJECTIVE, ADJECTIVE_CHAIN\n", - "\tlegal attributes: frozenset({'comparison_degree', 'pattern'})\n", + "\tlegal attributes: frozenset({'pattern', 'comparison_degree'})\n", "\tdepth_limit: inf\n", "\twidth_limit: inf\n", "Rules:\n", @@ -1693,9 +1695,9 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.10" + "version": "3.6.12" } }, "nbformat": 4, "nbformat_minor": 1 -} +} \ No newline at end of file diff --git a/html/Praktikum_11.html b/html/Praktikum_11.html index 863c8f6..7acc134 100644 --- a/html/Praktikum_11.html +++ b/html/Praktikum_11.html @@ -1,13105 +1,14281 @@ + -Praktikum11 +Praktikum11 - - + + + + + + + + +a.anchor-link { + display: none; +} +.highlight { + margin: 0.4em; +} +/* Input area styling */ +.jp-InputArea { + overflow: hidden; +} - - - - + - + - -
-
+ -
-
-
+ -
-
-
-
+ -
-
-
-
+ -
-
-
-
+