International audiencePour beaucoup d'applications réelles nécessitant une prise de déci-sion séquentielle dans un cadre incertain, on utilise un processus de décision Markovien avec récompenses inconnues (IRMDP) en calculant naturellement des politiques stochastiques. Une politique stochastique n'est pas facilement in-terprétable pour l'utilisateur final. Celui-ci a souvent besoin d'une politique dé-terministe et compréhensible. Pour mieux motiver l'utilisation d'une procédure exacte pour trouver une politique déterministe, nous montrons quelques cas où l'idée intuitive d'utiliser une politique déterministe obtenue après une «déter-minisation» (arrondi) de la politique stochastique optimale donne une politique déterministe différente de la...
Article rédigé dans le cadre de l'ARP MathsInTerreL'équipe STEEP est une équipe-projet de recherche ...
Avec l'utilisation de systèmes multi-agents dans un contexte de modélisation d'accompagnement, la qu...
Si l'on veut bien se soucier de comprendre les problèmes singuliers qui structurent le champ des pol...
National audienceDans cet article, nous nous intéressons à un problème d'apprentissage actif consist...
National audienceRésoudre optimalement des processus décisionnels de Markov partiellement observable...
Colloque avec actes et comité de lecture. nationale.National audienceL'activité de veille, au sein d...
International audienceL'apprentissage par renforcement profond a connu un succès remarquable au cour...
Patrouiller implique habituellement une équipe d'agents dont le but consiste à visiter aussi fréquem...
La réduction de masse est une des solutions techniques adoptées dans l'industrie automobile, permett...
Cette recherche méthodologique vise à proposer un cadre d'évaluation élargissant le champ de l'évalu...
Les travaux présentés concernent trois thématiques connexes~: Interprétation et étude probabiliste d...
National audienceCet article est dédié à la validation des politiques d’adaptation en utilisant une ...
International audienceLe projet Mobisim (simulation des mobilités), actuellement en cours de dévelop...
International audienceLes systèmes d'aide au diagnostic médical illustrent comment à mesure que les ...
L'apprentissage par renforcement est une approche d'apprentissage automatique permettant de développ...
Article rédigé dans le cadre de l'ARP MathsInTerreL'équipe STEEP est une équipe-projet de recherche ...
Avec l'utilisation de systèmes multi-agents dans un contexte de modélisation d'accompagnement, la qu...
Si l'on veut bien se soucier de comprendre les problèmes singuliers qui structurent le champ des pol...
National audienceDans cet article, nous nous intéressons à un problème d'apprentissage actif consist...
National audienceRésoudre optimalement des processus décisionnels de Markov partiellement observable...
Colloque avec actes et comité de lecture. nationale.National audienceL'activité de veille, au sein d...
International audienceL'apprentissage par renforcement profond a connu un succès remarquable au cour...
Patrouiller implique habituellement une équipe d'agents dont le but consiste à visiter aussi fréquem...
La réduction de masse est une des solutions techniques adoptées dans l'industrie automobile, permett...
Cette recherche méthodologique vise à proposer un cadre d'évaluation élargissant le champ de l'évalu...
Les travaux présentés concernent trois thématiques connexes~: Interprétation et étude probabiliste d...
National audienceCet article est dédié à la validation des politiques d’adaptation en utilisant une ...
International audienceLe projet Mobisim (simulation des mobilités), actuellement en cours de dévelop...
International audienceLes systèmes d'aide au diagnostic médical illustrent comment à mesure que les ...
L'apprentissage par renforcement est une approche d'apprentissage automatique permettant de développ...
Article rédigé dans le cadre de l'ARP MathsInTerreL'équipe STEEP est une équipe-projet de recherche ...
Avec l'utilisation de systèmes multi-agents dans un contexte de modélisation d'accompagnement, la qu...
Si l'on veut bien se soucier de comprendre les problèmes singuliers qui structurent le champ des pol...