Obsah predmetu:
- Zdroje dát
- Objavovanie znalostí
- Oblasti objavovania znalostí
- Metodiky procesu objavovania znalostí
- Porozumenie problematike
- Porozumenie dátam
- Príprava dát
- Modelovanie dát
- Vyhodnotenie výsledkov
- Využitie výsledkov
Na priloženom logovacom súbore zopakujte postup, ktorý ste sa naučili za celý semester:
- Očistite dátový súbor od nepotrebných údajov (RequestMethod/Version, StatusCode, URL)
- Očistite dátový súbor od prístupov robotov vyhľadávacích služieb
- Identifikujte robotov na základe prístupu k súboru robots.txt (URL)
- Identifikujte robotov na základe poľa User-Agent (Agent)
- Vyselektujte z dátového súboru len vaše skúmané obdobie a vytvorte premennú UnixTime
- Identifikujte používateľov na základe IP adresy a poľa User-Agent
- Vytvorte premennú Length na základe User_ID a 60 min. STT.
- Identifikujte sedenia na základe metódy Reference Length (použite hodnotu pre podiel navigačných stránok: 40%)
- Doplňte chýbajúce požiadavky do identifikovaných sedení (dopĺňanie ciest)