Ovaj završni rad, bavi se analizom velikog skupa podataka koji redovito objavljuje tehnološka kompanija BackBlaze na svojim javnim Internet stranicama. Analiziramo strukturu objavljenih podataka te vodeći se principima CRISP-DM metodologije radimo na razumijevanju, pripremi i čišćenju podataka. U radu radimo različite upite nad bazom podataka, analizirajuću izvorne podatke u kontekstu poslovanja tehnološke tvrtke BackBlaze, uspoređujući podatke u vremenu pokušavajući dokazati da je analiziom tehničkih parametara diskovnih jedinica moguće dovoljno rano predvidjeti ispad pojedine diskovne jedinice. U ovom se radu pokušava pokazati da nadzorom vrijednosti nekih od velikog broja svakodnevno uzorkovanih podataka mogu s velikom vjerojatnošću pred...