Cette thèse fait des petits pas dans la construction et la compréhension des systèmes d'apprentissage des représentations neuronales et des modèles génératifs pour le traitement du langage naturel. Il est présenté comme une thèse par article qui contient quatre travaux. Dans le premier article, nous montrons que l'apprentissage multi-tâches peut être utilisé pour combiner les biais inductifs de plusieurs tâches d'apprentissage auto-supervisées et supervisées pour apprendre des représentations de phrases distribuées de longueur fixe à usage général qui obtiennent des résultats solides sur les tâches d'apprentissage par transfert en aval sans tout modèle de réglage fin. Le deuxième article s'appuie sur le premier et présente un modèle g...
Les réseaux neuronaux récurrents sont des outils efficaces pour modeler les données à structure séqu...
National audienceSciences cognitives (SC) Traitement automatique des langues (TAL) Buts : Descriptio...
Cette thèse porte sur une classe d'algorithmes d'apprentissage appelés architectures profondes. Il e...
Les modèles computationnels pour la compréhension automatique des textes ont suscité un vif intérêt ...
Extraire une représentation de tous les facteurs de haut niveau de l'état d'un agent à partir d'info...
Dans cette dissertation, nous présentons plusieurs techniques d’apprentissage d’espaces sémantiques ...
Ces dernières années, il y a eu un intérêt croissant dans le domaine de l'apprentissage profond pour...
RÉSUMÉ: Récemment, les “Masked Language Models” (MLMs) entrainés sur une large base de données non é...
En apprentissage automatique, domaine qui consiste à utiliser des données pour apprendre une solutio...
Le réseau de neurones récurrent (RNN) est l’un des plus puissants modèles d’apprentissage automatiqu...
Cette thèse traite de l'usage des Réseaux de Neurones pour modélisation de données séquentielles. La...
La recherche sur les réseaux de neurones a permis de réaliser de larges progrès durant la derniè...
Cette thèse par article contribue au domaine de l’apprentissage de représentations profondes, et plu...
Le réseau de neurones récurrent (RNN) est l’un des plus puissants modèles d’apprentissage automatiqu...
Cette thèse par article présente plusieurs contributions au domaine de l'apprentissage de représenta...
Les réseaux neuronaux récurrents sont des outils efficaces pour modeler les données à structure séqu...
National audienceSciences cognitives (SC) Traitement automatique des langues (TAL) Buts : Descriptio...
Cette thèse porte sur une classe d'algorithmes d'apprentissage appelés architectures profondes. Il e...
Les modèles computationnels pour la compréhension automatique des textes ont suscité un vif intérêt ...
Extraire une représentation de tous les facteurs de haut niveau de l'état d'un agent à partir d'info...
Dans cette dissertation, nous présentons plusieurs techniques d’apprentissage d’espaces sémantiques ...
Ces dernières années, il y a eu un intérêt croissant dans le domaine de l'apprentissage profond pour...
RÉSUMÉ: Récemment, les “Masked Language Models” (MLMs) entrainés sur une large base de données non é...
En apprentissage automatique, domaine qui consiste à utiliser des données pour apprendre une solutio...
Le réseau de neurones récurrent (RNN) est l’un des plus puissants modèles d’apprentissage automatiqu...
Cette thèse traite de l'usage des Réseaux de Neurones pour modélisation de données séquentielles. La...
La recherche sur les réseaux de neurones a permis de réaliser de larges progrès durant la derniè...
Cette thèse par article contribue au domaine de l’apprentissage de représentations profondes, et plu...
Le réseau de neurones récurrent (RNN) est l’un des plus puissants modèles d’apprentissage automatiqu...
Cette thèse par article présente plusieurs contributions au domaine de l'apprentissage de représenta...
Les réseaux neuronaux récurrents sont des outils efficaces pour modeler les données à structure séqu...
National audienceSciences cognitives (SC) Traitement automatique des langues (TAL) Buts : Descriptio...
Cette thèse porte sur une classe d'algorithmes d'apprentissage appelés architectures profondes. Il e...