Analiziral bom karte iz vsakega pomembnejšega seta Magic: the Gathering. Podatke bom vzel s strani MTGStocks.com, saj so lahko dostopni in bolj popolni kot na evropski spletni strani. Na njej je mogoče razbrati tudi povprečno evropsko ceno kart.
Datoteka ZajemPodatkov
zajame podatke, ki jih nato prečistimo z datoteko CiscenjePodatkov
. Analiza se nahaja v datoteki AnalizaPodatkov
, naivni Bayesov klasifikator pa v NaivniBayesZaDolocanjeBarve
.
- njen indeks na MTGStocks.com
- ime
- redkost
- set, v katerem se nahaja
- poveprečno ceno in povprečno ceno foil verzije karte (ameriški trg)
- povprečno ceno (evropski trg)
- najnižjo in najvišjo doseženo ceno ter datuma teh dogodkov (ameriški trg)
- ali je na reserved listu
- mana value, CMC in barvo karte
- supertype, card type in subtype
- oracle text
- kodo seta
- polno ime
- št. kart
- datum izida
Podatke sem shranil v mapo Podatki/Tabele_in_JSON
, glavna datoteka za analizo je bila popolni_podatki_o_kartah.json
. HTML datotek setov nisem naložil na GitHub.
- Ali obstaja povezava med redkostjo in ceno kart?
- Ali obstaja povezava med starostjo in ceno kart?
- Kateri tipi kart so najbolj vredni?
- Kateri seti so najbolj vredni?
- Koliko časa od izida karte v povprečju dosežejo najnižjo ceno?
- Kakšne so razlike med ameriškim in evropskim trgom?
- Ali se da z naivnim Bayesovim klasifikatorjem ugotoviti barvo karte glede na oracle text?