Les problèmes de prise de décisions séquentielles multiagents sont difficiles à résoudre surtout lorsque les agents n'observent pas parfaitement l'état de Y environnement. Les approches existantes pour résoudre ces problèmes utilisent souvent des approximations de la fonction de valeur ou se basent sur la structure pour simplifier la résolution. Dans cette thèse, nous proposons d'approximer un problème de décisions séquentielles multiagent à observation limitée, modélisé par un processus décisionnel markovien décentralisé (DEC-MDP) en utilisant deux hypothèses sur la structure du problème. La première hypothèse porte sur la structure de comportement optimal et suppose qu'il est possible d'approximer la politique optimale d'un agent en conna...
National audienceNous proposons une approche heuristique pour calculer une politique approchée d'un ...
In this thesis we study some particle approximation methods of solutions to partial differential equ...
Ce rapport présente un état de l'art des techniques traitant du problème de la patrouille dans un sy...
National audienceRésoudre optimalement des processus décisionnels de Markov partiellement observable...
National audienceReinforcement Learning (RL) for decentralized partially observable Markov decision ...
Patrouiller implique habituellement une équipe d'agents dont le but consiste à visiter aussi fréquem...
On étudie dans ce manuscrit plusieurs problèmes d'approximation à l'aide des outils de la théorie du...
National audienceNous nous intéressons au problème consistant à trouver une politique jointe optimal...
Dans le secteur de la défense, la majorité des processus de combat soulèvent des problèmes complexes...
Traditionnellement, les travaux de recherche en décision séquentielle dans l'incertain avec observab...
My motivation during my PhD studies was to examine cooperative behaviour in complex systems using th...
National audienceNous présentons le cadre mathématique des processus décisionnels de Markov partiell...
Cet article considère des situations de décision récurrentes. Nous présentons des règles de comporte...
International audiencePour beaucoup d'applications réelles nécessitant une prise de déci-sion séquen...
National audienceConflicts are first-class citizen in Multi-Agents Systems and negotiation allows to...
National audienceNous proposons une approche heuristique pour calculer une politique approchée d'un ...
In this thesis we study some particle approximation methods of solutions to partial differential equ...
Ce rapport présente un état de l'art des techniques traitant du problème de la patrouille dans un sy...
National audienceRésoudre optimalement des processus décisionnels de Markov partiellement observable...
National audienceReinforcement Learning (RL) for decentralized partially observable Markov decision ...
Patrouiller implique habituellement une équipe d'agents dont le but consiste à visiter aussi fréquem...
On étudie dans ce manuscrit plusieurs problèmes d'approximation à l'aide des outils de la théorie du...
National audienceNous nous intéressons au problème consistant à trouver une politique jointe optimal...
Dans le secteur de la défense, la majorité des processus de combat soulèvent des problèmes complexes...
Traditionnellement, les travaux de recherche en décision séquentielle dans l'incertain avec observab...
My motivation during my PhD studies was to examine cooperative behaviour in complex systems using th...
National audienceNous présentons le cadre mathématique des processus décisionnels de Markov partiell...
Cet article considère des situations de décision récurrentes. Nous présentons des règles de comporte...
International audiencePour beaucoup d'applications réelles nécessitant une prise de déci-sion séquen...
National audienceConflicts are first-class citizen in Multi-Agents Systems and negotiation allows to...
National audienceNous proposons une approche heuristique pour calculer une politique approchée d'un ...
In this thesis we study some particle approximation methods of solutions to partial differential equ...
Ce rapport présente un état de l'art des techniques traitant du problème de la patrouille dans un sy...