Celem pracy jest przedstawienie algorytmów nauczania przez wzmacnianie. Omówione zostają metody rozwiązujące problemy z jednym stanem. Po wprowadzeniu pojęcia decyzyjnych procesów Markowa, zostaje wyprowadzone i omówione równanie Bellmana. Pod koniec pracy przedstawione są dwa algorytmy nauczania przez wzmacnianie - Sarsa oraz Q-Learning, oraz przy użyciu drugiego z nich, rozwiązany jest problem sterowania.The purpose of this thesis is to present the basics of reinforcement learning algorithms. Firstly, methods of solving one state problems are presented. After introducing the concept of Markov decision process, the Bellman equation is derived and described. At the end of this paper, Sarsa and Q-Learning algorithms are introduced and compar...
Podržano učenje je jedna kategorija strojnog učenja, uz nadzirano i nenadzirano učenje, te je ono na...
Razvoj sustava koji sami uče jedan je od važnijih problema računarske znanosti. Poseban izazov preds...
V magistrskemu delu predstavimo akademijo učenja logičnih operatorjev z markovskimi jedri, katero so...
Celem pracy jest analiza doboru efektywnych parametrów do algorytmów uczenia się ze wzmocnieniem, an...
Cilj je ovoga diplomskog rada objasniti učenje podrškom - paradigmu učenja neuronskih mreža koja se ...
Ovaj diplomski rad proučava podskupinu strojnog učenja koja se naziva podržano učenje. U radu pokri...
Uczenie przez wzmacnianie jest jedną z gałęzi uczenia maszynowego w której celem jest znalezienie op...
Tato bakalářská práce se zabývá použitím metod strojového učení označované jako Posilované učení (Re...
Bakalářská práce Zpětnovazební učení pro řešení herních algoritmů je rozdělena do dvou částí. V teor...
U ovom je radu obrađeno podržano učenje kao vrsta strojnog učenja čiji je cilj maksimizirati ukupnu ...
V diplomskem delu predstavljamo samoojačitveno učenje, ki je področje strojnega učenja in se ukvarja...
Celem pracy jest rozwiązanie problemu decyzyjnego Markowa (MDP). Korzystamy z programowania dynamicz...
This thesis addresses the issue of modeling the agent navigation in a benign environment by using re...
The main goal of this thesis was the evaluation and implementation of two types of reinforcement lea...
Ovaj se rad bavi osnovama podržanog učenja iznoseći sve poznate metode korištene u PU poput Bellmano...
Podržano učenje je jedna kategorija strojnog učenja, uz nadzirano i nenadzirano učenje, te je ono na...
Razvoj sustava koji sami uče jedan je od važnijih problema računarske znanosti. Poseban izazov preds...
V magistrskemu delu predstavimo akademijo učenja logičnih operatorjev z markovskimi jedri, katero so...
Celem pracy jest analiza doboru efektywnych parametrów do algorytmów uczenia się ze wzmocnieniem, an...
Cilj je ovoga diplomskog rada objasniti učenje podrškom - paradigmu učenja neuronskih mreža koja se ...
Ovaj diplomski rad proučava podskupinu strojnog učenja koja se naziva podržano učenje. U radu pokri...
Uczenie przez wzmacnianie jest jedną z gałęzi uczenia maszynowego w której celem jest znalezienie op...
Tato bakalářská práce se zabývá použitím metod strojového učení označované jako Posilované učení (Re...
Bakalářská práce Zpětnovazební učení pro řešení herních algoritmů je rozdělena do dvou částí. V teor...
U ovom je radu obrađeno podržano učenje kao vrsta strojnog učenja čiji je cilj maksimizirati ukupnu ...
V diplomskem delu predstavljamo samoojačitveno učenje, ki je področje strojnega učenja in se ukvarja...
Celem pracy jest rozwiązanie problemu decyzyjnego Markowa (MDP). Korzystamy z programowania dynamicz...
This thesis addresses the issue of modeling the agent navigation in a benign environment by using re...
The main goal of this thesis was the evaluation and implementation of two types of reinforcement lea...
Ovaj se rad bavi osnovama podržanog učenja iznoseći sve poznate metode korištene u PU poput Bellmano...
Podržano učenje je jedna kategorija strojnog učenja, uz nadzirano i nenadzirano učenje, te je ono na...
Razvoj sustava koji sami uče jedan je od važnijih problema računarske znanosti. Poseban izazov preds...
V magistrskemu delu predstavimo akademijo učenja logičnih operatorjev z markovskimi jedri, katero so...