Skip to content
Simone edited this page Jul 25, 2015 · 1 revision

Lo studio proposto punta a realizzare uno strumento per analizzare il funziona- mento di un cluster che utilizza il framework Hadoop. Diversi sono gli input che il tool puo analizzare a seconda delle esigenze. In particolare analizza i seguenti tipi di le: '.csv' generati con dstat '.txt' generati con il proler java '.man' che raccolgono i log generati dal framework Hadoop Il tool genera graci rappresentanti l'andamento di ciascuna macchina del clus- ter. I le '.csv' possono essere recuperati installando sul master e sugli slave rispettivamente un client e vari server appositamente realizzati. A tale scopo e possibile utilizzare librerie java o R[8]. In base alla modalita di generazione selezionata dall'utente (R, java) e possibile istruire il tool al ne di generare eventuali 'warning charts' che danno suggerimenti per utilizzare il cluster in maniera pi eciente. E possibile inoltre visualizzare una timeline dei task svolti dal framework Hadoop, generabile dando in input i le '.man' generati con uno script python appositamente realizzato. L'output realizzato varia a seconda delle librerie selezionate dall'utente (R o java) e puo essere: Pagina web - java le pdf - R I capitoli successivi analizzeranno in dettaglio quanto realizzato.

Clone this wiki locally