U ovom radu objašnjena su teorijska načela potrebna za shvaćanje osnovne problematike dubokog podržanog učenja i izučavani su različiti algoritmi kojima je moguće riješiti problem dubokog podržanog učenja s primjenom na video igre. Algoritmi koji su obrađeni u okviru rada su: duboka Q mreža, dvostruka duboka Q mreža, suparnička dvostruka duboka Q mreža te asinkroni prednosni akter-kritičar. U okviru rada su implementirani svi obrađeni algoritmi, provedena su mjerenja nad njima na temelju igre Atari Breakout i uspoređeni su rezultati mjerenja. Rezultati mjerenja pokazuju da je asinkroni prednosni akter-kritičar algoritam koji nudi najbolje performanse s obzirom na vremenske i sklopovske resurse koji su potrebni pri rješavanju problema duboko...