Grupiranje podataka jedna je od najbitnijih metoda analize podataka te je u gotovo svim slučajevima prvi korak daljnje analize. U današnje vrijeme veliki servisi kao što su Google i Facebook u svojim bazama spremaju terabajte podataka. Podaci pristižu u prirodnom poretku, to jest bez definiranog redoslijeda te ih je potrebno grupirati u smislene cjeline. Problem grupiranja trivijalno je rješiv iscrpnom pretragom. Međutim, rezultati analize podataka potrebni su u realnom vremenu sto nikako nije izvedivo iscrpnom pretragom budući da je problem grupiranja NP-težak problem. Rad započinje s definiranjem osnovnih pojmova i matematičkim modeliranjem problema grupiranja. Nakon uvodnih definicija opisane su osnovne metode grupiranja: hijerarhijsko i...