Ovim radom opisane su korištene tehnologije i objašnjeni su elementi strojnog učenja koji su korišteni za treniranje agenta. Cilj je istrenirati agenta za rješavanje razina platformske igre koristeći ML-Agents alat. Izrađene su dvije okoline u Unityju za treniranje agenta, jedna jednostavna i jedna napredna. Jednostavna okolina je korištena za usporedbu PPO i SAC algoritama koji se koriste za podržano strojno učenje. Na temelju te usporedbe algoritama, efikasniji, PPO algoritam korišten je za treniranje agenta u naprednoj okolini. Uspješnost treniranja ispitana je na tri razine platformske igre. Rezultat ovog rada je uspješno istrenirani agent koji na temelju naučenog dolazi do cilja razine izbjegavajući zamke. Platformska igra se sastoji o...