S povećanjem količine dostupnih podataka i napredovanjem računala, primjena strojnog učenja doživjela je nevjerojatan rast u akademskim istraživanjima i u stvarnom životu, a performanse modela strojnog učenja uvelike ovise upravo o podacima nad kojima model uči. Glavni problem anonimizacije u kontekstu strojnog učenja je pronaći balans između korisnosti i sigurnosti – kako zaštititi podatke, a da se istovremeno sačuva dovoljna količina korisnih informacija na temelju kojih model može učiti. U sklopu ovog diplomskog rada provedeni su postupci analize i obrade nad dva skupa podataka – Melbourne Housing Market i Adult Income, koristeći Python programski jezik, nakon čega su izgrađeni modeli linearne regresije za određivanje cijene nekretnine, ...