Når Deepminds AlphaGo-program slo den menneskelige profesjonelle Go-spilleren Fan Hui i 2015 var dette et stort gjennombrudd for kunstig intelligens til spilling. Go hadde vist seg å motstå de teknikkene som lenge hadde slått mennesker i spill som sjakk. Gjennom en nyskapende kombinasjon av dype nevrale nettverk, forsterkende læring og Monte Carlo-tresøk ble Go endelig mestret. Kort tid etterpå kom AlphaGo Zero, som oppnådde det samme ved å lære utelukkende ved å spille mot seg selv, og AlphaZero, som generaliserte teknikken til andre spill. Dette arbeidet inneholder en nøye gjennomgang av disse systemene og arbeidet i feltet som ledet opp mot dem. Det går gjennom min egen implementasjon av denne teknikken og dens bruk i spillene Hex og Ot...
Denne masteroppgaven utforsker en metode for å løse høydimensjonale partielle differentialligninger ...
We explored the usage of Monte Carlo tree search (MCTS) and deep learning in order to predict game l...
Bacheloroppgaven er delt inn i en utviklings- og forskningsdel. I utviklingsdelen lager vi et system...
Bruken av "svart-boks"-modeller innen maskinlæring skaper problemer for systemer med fokus på sikker...
DeepMind’s development of AlphaGo took the world by storm in 2016 when it became the first computer ...
Dette studiet undersøker hvorvidt Dyp Forsterkende Læring (eng: Deep Reinforcement Learning) kan bru...
Innenfor kybernetikk er tilnærmingen til prosesskontroll ofte basert på eksplisitt design og impleme...
Modellbasert forsterkende læring er i stand til å oppnå mye høyere prøveeffektivitet enn modellfrie ...
Den økende mengden applikasjoner som involverer maskinlæringsmetoder, utgjør en utfordring når ekspe...
Denne oppgaven undersøker muligheten for å bruke Monte-Carlo-tre-søk for å redusere søkeområdet til ...
Det å forbedre roboters autonomi har lenge vært et mål for forskere. Ulike verktøy har blitt brukt f...
Sammen med dyp læring har Reinforcement Learning (forsterkningslæring) hatt flere gjennombrudd de si...
In self-play reinforcement learning an agent plays games against itself and with the help of hindsig...
The idea of using artificial intelligence to evaluatemilitary strategies is relevant for a large num...
Retten til helse er en grunnleggende menneskerettighet, men mange utfordringer står overfor de som ø...
Denne masteroppgaven utforsker en metode for å løse høydimensjonale partielle differentialligninger ...
We explored the usage of Monte Carlo tree search (MCTS) and deep learning in order to predict game l...
Bacheloroppgaven er delt inn i en utviklings- og forskningsdel. I utviklingsdelen lager vi et system...
Bruken av "svart-boks"-modeller innen maskinlæring skaper problemer for systemer med fokus på sikker...
DeepMind’s development of AlphaGo took the world by storm in 2016 when it became the first computer ...
Dette studiet undersøker hvorvidt Dyp Forsterkende Læring (eng: Deep Reinforcement Learning) kan bru...
Innenfor kybernetikk er tilnærmingen til prosesskontroll ofte basert på eksplisitt design og impleme...
Modellbasert forsterkende læring er i stand til å oppnå mye høyere prøveeffektivitet enn modellfrie ...
Den økende mengden applikasjoner som involverer maskinlæringsmetoder, utgjør en utfordring når ekspe...
Denne oppgaven undersøker muligheten for å bruke Monte-Carlo-tre-søk for å redusere søkeområdet til ...
Det å forbedre roboters autonomi har lenge vært et mål for forskere. Ulike verktøy har blitt brukt f...
Sammen med dyp læring har Reinforcement Learning (forsterkningslæring) hatt flere gjennombrudd de si...
In self-play reinforcement learning an agent plays games against itself and with the help of hindsig...
The idea of using artificial intelligence to evaluatemilitary strategies is relevant for a large num...
Retten til helse er en grunnleggende menneskerettighet, men mange utfordringer står overfor de som ø...
Denne masteroppgaven utforsker en metode for å løse høydimensjonale partielle differentialligninger ...
We explored the usage of Monte Carlo tree search (MCTS) and deep learning in order to predict game l...
Bacheloroppgaven er delt inn i en utviklings- og forskningsdel. I utviklingsdelen lager vi et system...