L'immense potentiel des approches d'apprentissage par renforcement profond (ARP) pour la conception d'agents autonomes a été démontré à plusieurs reprises au cours de la dernière décennie. Son application à des agents physiques, tels que des robots ou des réseaux électriques automatisés, est cependant confrontée à plusieurs défis. Parmi eux, l'inefficacité de leur échantillonnage, combinée au coût et au risque d'acquérir de l'expérience dans le monde réel, peut décourager tout projet d'entraînement d'agents incarnés. Dans cette thèse, je me concentre sur l'application de l'ARP sur des agents physiques. Je propose d'abord un cadre probabiliste pour améliorer l'efficacité de l'échantillonnage dans l'ARP. Dans un premier article, je présente ...
Important improvements have been done in robotics. More and more mobile robots and small unmanned ae...
Presented research works deal with the prediction and accuracy improvement of the parallel kinematic...
L'intelligence artificielle (IA) moderne a ouvert de nouvelles perspectives prometteuses pour la cré...
Les algorithmes actuels d'apprentissage profond par renforcement (RL) sont encore très spécifiques à...
L'ère numérique dans laquelle nous sommes entrés apporte une quantité importante de nouveaux défis à...
L'Imitation par observation (IPO) est un paradigme d'apprentissage qui consiste à entraîner des agen...
The most powerful artificial intelligence systems are now based on learned statisticalmodels. In ord...
This thesis deals with sensor-based control of robots. For a robot arm or a mobile robot, this appro...
National audienceReinforcement Learning (RL) for decentralized partially observable Markov decision ...
Ce mémoire rassemble des éléments d'optimisation, d'apprentissage profond et de contrôle optimal af...
Les algorithmes d’apprentissage par renforcement conditionné par les buts apprennent à accomplir de...
Thesis work fits in the area of multiprocessor real-time computing under energy constraints. It aims ...
Numerous applications can be formulated in terms of distributed systems, be it a necessity face to a...
We are interested in online forecasting of an arbitrary sequence of observations. At each time step,...
L'apprentissage fédéré est un paradigme émergent qui permet à un grand nombre de clients disposant d...
Important improvements have been done in robotics. More and more mobile robots and small unmanned ae...
Presented research works deal with the prediction and accuracy improvement of the parallel kinematic...
L'intelligence artificielle (IA) moderne a ouvert de nouvelles perspectives prometteuses pour la cré...
Les algorithmes actuels d'apprentissage profond par renforcement (RL) sont encore très spécifiques à...
L'ère numérique dans laquelle nous sommes entrés apporte une quantité importante de nouveaux défis à...
L'Imitation par observation (IPO) est un paradigme d'apprentissage qui consiste à entraîner des agen...
The most powerful artificial intelligence systems are now based on learned statisticalmodels. In ord...
This thesis deals with sensor-based control of robots. For a robot arm or a mobile robot, this appro...
National audienceReinforcement Learning (RL) for decentralized partially observable Markov decision ...
Ce mémoire rassemble des éléments d'optimisation, d'apprentissage profond et de contrôle optimal af...
Les algorithmes d’apprentissage par renforcement conditionné par les buts apprennent à accomplir de...
Thesis work fits in the area of multiprocessor real-time computing under energy constraints. It aims ...
Numerous applications can be formulated in terms of distributed systems, be it a necessity face to a...
We are interested in online forecasting of an arbitrary sequence of observations. At each time step,...
L'apprentissage fédéré est un paradigme émergent qui permet à un grand nombre de clients disposant d...
Important improvements have been done in robotics. More and more mobile robots and small unmanned ae...
Presented research works deal with the prediction and accuracy improvement of the parallel kinematic...
L'intelligence artificielle (IA) moderne a ouvert de nouvelles perspectives prometteuses pour la cré...