Skip to content

Commit

Permalink
11. praktikumi uuendus
Browse files Browse the repository at this point in the history
  • Loading branch information
eisandra committed Jan 7, 2021
1 parent 3d6ee6f commit 33f112c
Show file tree
Hide file tree
Showing 2 changed files with 13,910 additions and 12,763 deletions.
16 changes: 9 additions & 7 deletions Praktikum11/Praktikum11.ipynb
Original file line number Diff line number Diff line change
Expand Up @@ -212,7 +212,7 @@
"name": "stderr",
"output_type": "stream",
"text": [
"100%|█████████████████████████████████████████████████████████████████| 10000000/10000000 [00:04<00:00, 2144980.78it/s]\n"
"100%|█████████████████████████████████████████████████████████████████| 10000000/10000000 [00:08<00:00, 1231744.87it/s]\n"
]
}
],
Expand Down Expand Up @@ -319,7 +319,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"### Ülesanne 2. Isikute ja asukohtadega seotud informatsiooni ekstraheerimine tekstist (2p)"
"### Ülesanne 2. Isikute ja asukohtadega seotud informatsiooni ekstraheerimine tekstist (2,5p)"
]
},
{
Expand Down Expand Up @@ -359,7 +359,9 @@
" \n",
"* kui tuvastatud osalauses leidub ka pärisnimele viitavaid nimega üksusi (PER), siis tuleks kontrollida, kas vähemalt mõnel neist on midagi ühist failinimes oleva kunstniku nimega (ees- või perekonnanimi - võime oletada, et kui Aado Vabbe failis räägitakse Aadost, siis on tegu ikka selle sama kunstnikuga, aga kui Viiraltist, siis ilmselt mitte). Kui tundub, et osalause räägib ainult mõnest teisest isikust, siis ärme sellest osalausest leitud asukohale ja/või kunstistiilidele tähelepanu pööra.\n",
"* kui tuvastatud osalauses pärisnimele viitavaid üksusi üldse ei leidu, siis omistame leitud asukohad ja kunstivoolud kunstnikule, kelle nime leiame faili nimest\n",
"* väljundiks peaks olema kaks json-formaadis faili - üks sisaldab iga kunstniku asukohti, teine iga kunstniku viljeldud kunstistiile. Kunstnike nimed on sellisel kujul nagu failinimedes."
"* väljundiks peaks olema kaks json-formaadis faili - üks sisaldab iga kunstniku asukohti, teine iga kunstniku viljeldud kunstistiile. Kunstnike nimed on sellisel kujul nagu failinimedes.\n",
"\n",
"**NB2! Nimeolemite eraldamisel tuleb siingi arvestada, et töö võib olla ajamahukas**"
]
},
{
Expand Down Expand Up @@ -1005,7 +1007,7 @@
"source": [
"Märgendatavale kihile lisage ka atribuut, mis sisaldab järjendit normaliseeritud fraasist: viige leitud fraasid kujule \"suur õun\" e omadussõna, millele järgneb nimisõna. Kui leidub mitu omadussõna, tehke igast eraldi fraas (\"suur ja sinine õun\" -> [\"suur õun\", \"sinine õun\"]), kusjuures fraas peaks olema algvormis. Mitmeste analüüside puhul jälgige, et algvorm oleks korrektne (\"tehtud töö\", mitte \"tegema töö\").\n",
"\n",
"**0,5 boonuspunkti** saab teenida fraaside täpsema filtreerimisega. Uuri väljundist, milliseid ebatäpsusi näed (alustuseks nt laused *Olen Tartu **esindustest ostnud** probleemivabalt* või *Õnneks sai mul üks **tuttav garantiiga** aidata*) ning paranda taggerit nii, et see likvideeriks mõne vigadest (kirjelda, milliseid vigu parandasid)."
"**0,5 boonuspunkti** saab teenida fraaside täpsema filtreerimisega. Uuri väljundist, milliseid ebatäpsusi näed ning paranda taggerit nii, et see likvideeriks mõne vigadest (kirjelda, milliseid vigu parandasid). Vihje: alustuseks võiks mõelda näiteks, mis on (süsteemselt) valesti lausetes *Olen Tartu **esindustest ostnud** probleemivabalt* või *Õnneks sai mul üks **tuttav garantiiga** aidata*."
]
},
{
Expand Down Expand Up @@ -1153,7 +1155,7 @@
"\tstart: ADJECTIVE_CHAIN\n",
"\tterminals: J, MSEQ(A), MSEQ(C)\n",
"\tnonterminals: ADJECTIVE, ADJECTIVE_CHAIN\n",
"\tlegal attributes: frozenset({'comparison_degree', 'pattern'})\n",
"\tlegal attributes: frozenset({'pattern', 'comparison_degree'})\n",
"\tdepth_limit: inf\n",
"\twidth_limit: inf\n",
"Rules:\n",
Expand Down Expand Up @@ -1693,9 +1695,9 @@
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.6.10"
"version": "3.6.12"
}
},
"nbformat": 4,
"nbformat_minor": 1
}
}
Loading

0 comments on commit 33f112c

Please sign in to comment.