La phase de préparation du processus de fouille des données est critique pour la qualité des résultats et consomme typiquement de l'ordre de 80% d'une étude. Dans cette thèse, nous nous interessons à l'évaluation automatique d'une représentation, en vue de l'automatisation de la préparation des données. A cette fin, nous introduisons une famille de modèles non paramétriques pour l'estimation de densité, baptisés modèles en grille. Chaque variable étant partitionnée en intervalles ou groupes de valeurs selon sa nature numérique ou catégorielle, l'espace complet des données est partitionné en une grille de cellules résultant du produit cartésien de ces partitions univariées. On recherche alors un modèle ou l'estimation de densité est constant...
Deux points clés de l’apprentissage machine et des statistiques modernes sont la modélisation parcim...
Document de travail de l'IME, n°20, avril 1977en ligne sur http://lara.inist.fr/bitstream/handle/233...
Les technologies numériques ont engendré depuis peu, des volumes de données importants, qui peuvent ...
The data preparation step of the data mining process represents 80% of the problem and is both time ...
Les surfaces de réponses, dites aussi méta-modèles sont généralement utilisées pour remplacer une fo...
Mettre en oeuvre une procédure de mesure passe par la modélisation préalable du phénomène observé. M...
Une donnée peut avoir diverses formes et peut provenir d'un large panel d'applications. Habituelleme...
Cette thèse traite de la modélisation et de l’estimation de modèles de mélanges d’experts de grande ...
Cette thèse porte sur le développement de méthodes combinatoires pour le test et la vérification for...
De nombreux algorithmes d'estimation fonctionnelle existent pour l'apprentissage statistique supervi...
L'objectif de ce mémoire est d'évaluer, dans le cadre des APDRG, l'apport d'un modèle de régression ...
Avec l’informatisation accrue de toutes les sphères d’activités de la société, nous assistons de nos...
Dans cette thèse, nous examinons plusieurs aspects de l'estimation des paramètres pour les statistiq...
Les modèles à sur-représentation de zéros discrets et continus ont une large gamme d'applications et...
Nous proposons deux nouvelles approches pour les systèmes de recommandation et les réseaux. Dans la ...
Deux points clés de l’apprentissage machine et des statistiques modernes sont la modélisation parcim...
Document de travail de l'IME, n°20, avril 1977en ligne sur http://lara.inist.fr/bitstream/handle/233...
Les technologies numériques ont engendré depuis peu, des volumes de données importants, qui peuvent ...
The data preparation step of the data mining process represents 80% of the problem and is both time ...
Les surfaces de réponses, dites aussi méta-modèles sont généralement utilisées pour remplacer une fo...
Mettre en oeuvre une procédure de mesure passe par la modélisation préalable du phénomène observé. M...
Une donnée peut avoir diverses formes et peut provenir d'un large panel d'applications. Habituelleme...
Cette thèse traite de la modélisation et de l’estimation de modèles de mélanges d’experts de grande ...
Cette thèse porte sur le développement de méthodes combinatoires pour le test et la vérification for...
De nombreux algorithmes d'estimation fonctionnelle existent pour l'apprentissage statistique supervi...
L'objectif de ce mémoire est d'évaluer, dans le cadre des APDRG, l'apport d'un modèle de régression ...
Avec l’informatisation accrue de toutes les sphères d’activités de la société, nous assistons de nos...
Dans cette thèse, nous examinons plusieurs aspects de l'estimation des paramètres pour les statistiq...
Les modèles à sur-représentation de zéros discrets et continus ont une large gamme d'applications et...
Nous proposons deux nouvelles approches pour les systèmes de recommandation et les réseaux. Dans la ...
Deux points clés de l’apprentissage machine et des statistiques modernes sont la modélisation parcim...
Document de travail de l'IME, n°20, avril 1977en ligne sur http://lara.inist.fr/bitstream/handle/233...
Les technologies numériques ont engendré depuis peu, des volumes de données importants, qui peuvent ...