La thèse se place dans le contexte de l'apprentissage statistique. On s'intéresse au problème de la classification supervisée des données de grande dimension. Dans un premier temps, nous introduisons les principes de la théorie de Vapnik et de la sélection de modèles, et présentons les grandes familles de méthodes de sélection de variables. Dans un deuxième temps, nous nous proposons de nouveaux outils de sélection de modèles et de réduction de la dimension. Au chapitre 3, nous proposons un estimateur du biais entre le risque conditionnel et le risque empirique d'une règle de classification. Cet estimateur est ensuite utilisé pour l'élaboration d'un critère pénalisé de sélection de modèles appelé Swapping. La pénalité est alors basée sur le...
Dans le cadre de la régression, de nombreuses études s’intéressent au problème dit de la grande dime...
La sélection de variables est une étape de réduction de dimension courante en apprentissage. Nous pr...
Au vu de l'augmentation du nombre de jeux de données de grande dimension, la sélection de variables ...
Diplôme : Dr. d'UniversitéThis thesis takes place within the framework of statistical learning. We s...
Le thème principal d'étude de cette thèse est la modélisation et la classification des données de gr...
CETTE THESE S'INSCRIT DANS LE CADRE DE LA STATISTIQUE NON PARAMETRIQUE ET PORTE SUR LA CLASSIFICATIO...
Cette thèse traite de la modélisation et de l’estimation de modèles de mélanges d’experts de grande ...
Cette thèse traite de la modélisation et de l’estimation de modèles de mélanges d’experts de grande ...
Le sujet de cette thèse est la classification semi-supervisée qui est considérée d'un point de vue d...
Cette thèse s'inscrit dans le cadre de l'apprentissage statistique et est consacrée à l'étude de la ...
National audienceNous considérons dans ce travail le problème du clustering en grande dimension. Nou...
Il existe des situations de modélisation statistique pour lesquelles le problème classique de classi...
Les avancées technologiques ont permis le stockage de grandes masses de données en termes de taille ...
Cette thèse traite les problèmes statistiques suivants : la sélection de variables dans le modèle de...
This thesis deals with non parametric statistics and is related to classification and discrimination...
Dans le cadre de la régression, de nombreuses études s’intéressent au problème dit de la grande dime...
La sélection de variables est une étape de réduction de dimension courante en apprentissage. Nous pr...
Au vu de l'augmentation du nombre de jeux de données de grande dimension, la sélection de variables ...
Diplôme : Dr. d'UniversitéThis thesis takes place within the framework of statistical learning. We s...
Le thème principal d'étude de cette thèse est la modélisation et la classification des données de gr...
CETTE THESE S'INSCRIT DANS LE CADRE DE LA STATISTIQUE NON PARAMETRIQUE ET PORTE SUR LA CLASSIFICATIO...
Cette thèse traite de la modélisation et de l’estimation de modèles de mélanges d’experts de grande ...
Cette thèse traite de la modélisation et de l’estimation de modèles de mélanges d’experts de grande ...
Le sujet de cette thèse est la classification semi-supervisée qui est considérée d'un point de vue d...
Cette thèse s'inscrit dans le cadre de l'apprentissage statistique et est consacrée à l'étude de la ...
National audienceNous considérons dans ce travail le problème du clustering en grande dimension. Nou...
Il existe des situations de modélisation statistique pour lesquelles le problème classique de classi...
Les avancées technologiques ont permis le stockage de grandes masses de données en termes de taille ...
Cette thèse traite les problèmes statistiques suivants : la sélection de variables dans le modèle de...
This thesis deals with non parametric statistics and is related to classification and discrimination...
Dans le cadre de la régression, de nombreuses études s’intéressent au problème dit de la grande dime...
La sélection de variables est une étape de réduction de dimension courante en apprentissage. Nous pr...
Au vu de l'augmentation du nombre de jeux de données de grande dimension, la sélection de variables ...