Le dilemme entre exploration et exploitation est un problème important en apprentissage par renforcement (AR). Les approches associées les plus efficaces utilisent généralement une information d'incertitude des valeurs estimées pendant l'apprentissage. D'un autre côté, la prise en compte de grands espaces d'état est problématique en AR et l'approximation de la fonction de valeur est devenue un domaine de recherche important. Ces deux problèmes co-existent dans la plupart des applications. Cependant, peu d'approches permettent à la fois d'approcher la fonction de valeur et d'en déduire une information d'incertitude sur les estimations. Dans cet article, nous montrons comment une telle information d'incertitude se déduit naturellement d'un ca...
Le bon fonctionnement des réseaux de digues et de voiries constitue un enjeu majeur pour la gestion ...
La pratique courante des laboratoires pour estimer l'incertitude est d'évaluer la confiance en un ré...
International audienceEn raison de sa variabilité et de l'incertitude qui pèse sur son estimation, l...
Le dilemme entre exploration et exploitation est un problème important en apprentissage par renforce...
Le dilemme entre exploration et exploitation est un problème important en apprentissage par renforce...
Evaluer la contribution des différentes sources d'erreur d'un jaugeage donné offre un outil pratique...
Evaluer la contribution des différentes sources d'erreur d'un jaugeage donné offre un outil pratique...
Evaluer la contribution des différentes sources d'erreur d'un jaugeage donné offre un outil pratique...
Dans cette thèse, nous nous intéressons aux problèmes de décision séquentielle dans l'incertain. Ces...
International audienceUn des thèmes importants de l'apprentissage par renforcement est l'approximati...
International audienceUn des thèmes importants de l'apprentissage par renforcement est l'approximati...
International audienceUn des thèmes importants de l'apprentissage par renforcement est l'approximati...
Lors des crises (sécheresses ou crues) les données hydrométriques participent directement aux proces...
Dans le cadre du projet nommé « Brique Incertitudes et Apprentissage Statistique » (BIAS) de l'Insti...
Le travail présenté dans cette thèse traite des problèmes d'optimisation combinatoire avec des donné...
Le bon fonctionnement des réseaux de digues et de voiries constitue un enjeu majeur pour la gestion ...
La pratique courante des laboratoires pour estimer l'incertitude est d'évaluer la confiance en un ré...
International audienceEn raison de sa variabilité et de l'incertitude qui pèse sur son estimation, l...
Le dilemme entre exploration et exploitation est un problème important en apprentissage par renforce...
Le dilemme entre exploration et exploitation est un problème important en apprentissage par renforce...
Evaluer la contribution des différentes sources d'erreur d'un jaugeage donné offre un outil pratique...
Evaluer la contribution des différentes sources d'erreur d'un jaugeage donné offre un outil pratique...
Evaluer la contribution des différentes sources d'erreur d'un jaugeage donné offre un outil pratique...
Dans cette thèse, nous nous intéressons aux problèmes de décision séquentielle dans l'incertain. Ces...
International audienceUn des thèmes importants de l'apprentissage par renforcement est l'approximati...
International audienceUn des thèmes importants de l'apprentissage par renforcement est l'approximati...
International audienceUn des thèmes importants de l'apprentissage par renforcement est l'approximati...
Lors des crises (sécheresses ou crues) les données hydrométriques participent directement aux proces...
Dans le cadre du projet nommé « Brique Incertitudes et Apprentissage Statistique » (BIAS) de l'Insti...
Le travail présenté dans cette thèse traite des problèmes d'optimisation combinatoire avec des donné...
Le bon fonctionnement des réseaux de digues et de voiries constitue un enjeu majeur pour la gestion ...
La pratique courante des laboratoires pour estimer l'incertitude est d'évaluer la confiance en un ré...
International audienceEn raison de sa variabilité et de l'incertitude qui pèse sur son estimation, l...