Set alata za potporno učenje spojen je sa simulatorom fizike kako bi dao cjelovit sustav za simuliranje agenata koji kontroliraju robotičke manipulatore. Vodi se rasprava o teoretskim implikacijama te opisom zadane konstrukcije. Rezultati dokazaju funkcionalnost zamišljenog koncepta, dva različita algoritma daju konvergentne politike odlučivanja za robota sa zadaćom dolaska na traženo mjesto u prostoru. Daljnja istraživanja su moguća u smjeru uređivanja okoline za potporno učenje i isprobavanje različitih algoritamaA reinforcement learning API is combined with a physics simulator to make a pipeline for simulating agents controlling robotic manipulators. Theoretical implications are discussed, followed by the description of such a constructi...