Tema ovog diplomskog rada je analiza S proteina iz koronavirusa. Tehnika strojnog učenja i statističke analize generaliziraju se na nizovima sa crticom. Na početku su dani matematički pojmovi potrebni za razumijevanje termina koji su korišteni u radu i objašnjena je struktura podataka. Na pripremljenim podacima primjenjuje se k-means++ klasteriranje, traženje najznačajnijih pozicija za klasteriranje, rangiranje po standardnim devijacijama pojedine pozicije, traženje popratnih mutacija pomoću omjera. Sve analize u diplomskom radu (grafovi, stupčasti dijagrami, tablice) napravljene su u programskom jeziku Python.The topic of this thesis is the analysis of S protein from coronavirus. Machine learning techniques and statistical analysis are gen...