Ovaj diplomski rad se bavi velikim skupovima podataka i svime što se veže uz njih. Opisana je povijest, sadašnjost i budućnost velikih skupova podataka, kao i njihova primjena u svakodnevnom životu. Kako bi iskoristili potencijal koji nam pružaju veliki skupovi podataka, moramo ih znati obraditi i analizirati s odgovarajućim tehnologijama za rad. U ovom radu opisane su pojedine tehnologije za rad, a najveća pozornost je dana Apache Hadoopu. Istražuje se njegov nastanak, opisuje arhitektura i način rada te njegove prednosti i mane. U praktičnom dijelu diplomskog rada je prikazano kako se koristiti tehnologijama te je cilj dobiti korisne informacije, koje će nam pomoći da dobijemo bolji uvid u ono što nas zanima. Zadatak je prikupiti statuse ...