Dans cette thèse, nous étudions différents aspects théoriques de l'apprentissage profond, en particulier l'optimisation, la robustesse et l'approximation. Optimisation: Nous étudions le paysage d'optimisation du risque empirique des réseaux neuronaux linéaires profonds avec la perte des moindres carrées. Il est connu que, sous des hypothèses faibles, il n'y a pas de minimiseurs locaux non-globaux et pas de maximiseurs locaux. Cependant, l'existence et la diversité des points selle non-stricts, qui peuvent jouer un rôle dans la dynamique des algorithmes du premier ordre, n'ont été que peu étudiées. Nous fournissons une analyse complète du paysage d'optimisation à l'ordre 2. Nous caractérisons, parmi tous les points critiques, les minimiseurs...
The success of deep learning has shown impressive empirical breakthroughs, but many theoretical ques...
The landscape of the empirical risk of overparametrized deep convolutional neural networks (DCNNs) i...
Cette thèse débute par l'étude d'architectures profondes à noyaux pour les données complexes. L'une ...
In this thesis, we study different theoretical aspects of deep learning, in particular optimization,...
This thesis develops and studies some principled methods for Deep Learning (DL) and deep Reinforceme...
A main puzzle of deep networks revolves around the absence of overfitting despite overparametrizatio...
Les réseaux de neurones profonds sont la pierre angulaire des systèmes à la fine pointe de la techno...
This article provides a comprehensive understanding of optimization in deep learning, with a primary...
The current challenge of Deep Learning is no longer the computational power nor its scope of applica...
Les algorithmes d'apprentissage profond forment un nouvel ensemble de méthodes puissantes pour l'ap...
In the last decade or so, deep learning has revolutionized entire domains of machine learning. Neura...
The general features of the optimization problem for the case of overparametrized nonlinear networks...
Since 2006, deep learning algorithms which rely on deep architectures with several layers of increas...
Deep learning training consumes ever-increasing time and resources, and that isdue to the complexity...
It has been empirically observed in deep learning that the training problem of deep over-parameteriz...
The success of deep learning has shown impressive empirical breakthroughs, but many theoretical ques...
The landscape of the empirical risk of overparametrized deep convolutional neural networks (DCNNs) i...
Cette thèse débute par l'étude d'architectures profondes à noyaux pour les données complexes. L'une ...
In this thesis, we study different theoretical aspects of deep learning, in particular optimization,...
This thesis develops and studies some principled methods for Deep Learning (DL) and deep Reinforceme...
A main puzzle of deep networks revolves around the absence of overfitting despite overparametrizatio...
Les réseaux de neurones profonds sont la pierre angulaire des systèmes à la fine pointe de la techno...
This article provides a comprehensive understanding of optimization in deep learning, with a primary...
The current challenge of Deep Learning is no longer the computational power nor its scope of applica...
Les algorithmes d'apprentissage profond forment un nouvel ensemble de méthodes puissantes pour l'ap...
In the last decade or so, deep learning has revolutionized entire domains of machine learning. Neura...
The general features of the optimization problem for the case of overparametrized nonlinear networks...
Since 2006, deep learning algorithms which rely on deep architectures with several layers of increas...
Deep learning training consumes ever-increasing time and resources, and that isdue to the complexity...
It has been empirically observed in deep learning that the training problem of deep over-parameteriz...
The success of deep learning has shown impressive empirical breakthroughs, but many theoretical ques...
The landscape of the empirical risk of overparametrized deep convolutional neural networks (DCNNs) i...
Cette thèse débute par l'étude d'architectures profondes à noyaux pour les données complexes. L'une ...