Cette thèse porte sur les méthodes dédiées à la manipulation des données massives. Nous présentons de nouveaux algorithmes dans le domaine de l’apprentissage automatique en utilisant des techniques de hashage tel que le Locality Sensitive Hashing (LSH) pour permettre un passage à l’échelle des algorithmes en réduisant leur complexité.Dans la première partie, nous étudions le problème du passage à l’échelle d’algorithmes de clustering inspirés du Mean Shift pour les données vectorielles continues. Nous proposons un nouvel algorithme utilisant un système de hachage(LSH) tout en bénéficiant du récent paradigme MapReduce appliqué aux systèmes distribués. Nous présentons également la variante de l’algorithme de clustering pour les données catégo...
Le clustering est une branche de l’apprentissage automatique consistant à diviser un ensemble de don...
Afin d'exploiter au mieux les ressources de traitement disponibles de type grille de calcul, pour la...
Cette thèse à publication propose d'étudier deux problématiques différentes : 1) la classification n...
Cette thèse porte sur les méthodes dédiées à la manipulation des données massives. Nous présentons d...
Nous proposons dans ces travaux des algorithmes distribués de clustering basé sur la taille destinés...
Cette thèse étudie deux tâches fondamentales d'apprentissage non supervisé: la recherche des plus pr...
Nous proposons dans ces travaux des algorithmes distribués de clusterisation destinés à répondre à l...
Nous proposons dans ces travaux des algorithmes distribués de clusterisation destinés à répondre à l...
Le clustering sous contraintes (une généralisation du clustering semi-supervisé) vise à exploiter le...
Lors de ces dernières années les volumes de données analysées par les entreprises et les laboratoire...
Notre capacité grandissante à collecter et stocker des données a fait de l'apprentissage non superv...
International audienceLe clustering de graphes est l'une des techniques clés qui permet de comprendr...
Clustering, qui consiste à réaliser des groupements naturels de données, est une tâche fondamentale ...
Comme une méthode d’apprentissage automatique non supervisé, la classification automatique est large...
Le clustering crédibiliste fondé sur la théorie des fonctions de croyance est devenu un sujet import...
Le clustering est une branche de l’apprentissage automatique consistant à diviser un ensemble de don...
Afin d'exploiter au mieux les ressources de traitement disponibles de type grille de calcul, pour la...
Cette thèse à publication propose d'étudier deux problématiques différentes : 1) la classification n...
Cette thèse porte sur les méthodes dédiées à la manipulation des données massives. Nous présentons d...
Nous proposons dans ces travaux des algorithmes distribués de clustering basé sur la taille destinés...
Cette thèse étudie deux tâches fondamentales d'apprentissage non supervisé: la recherche des plus pr...
Nous proposons dans ces travaux des algorithmes distribués de clusterisation destinés à répondre à l...
Nous proposons dans ces travaux des algorithmes distribués de clusterisation destinés à répondre à l...
Le clustering sous contraintes (une généralisation du clustering semi-supervisé) vise à exploiter le...
Lors de ces dernières années les volumes de données analysées par les entreprises et les laboratoire...
Notre capacité grandissante à collecter et stocker des données a fait de l'apprentissage non superv...
International audienceLe clustering de graphes est l'une des techniques clés qui permet de comprendr...
Clustering, qui consiste à réaliser des groupements naturels de données, est une tâche fondamentale ...
Comme une méthode d’apprentissage automatique non supervisé, la classification automatique est large...
Le clustering crédibiliste fondé sur la théorie des fonctions de croyance est devenu un sujet import...
Le clustering est une branche de l’apprentissage automatique consistant à diviser un ensemble de don...
Afin d'exploiter au mieux les ressources de traitement disponibles de type grille de calcul, pour la...
Cette thèse à publication propose d'étudier deux problématiques différentes : 1) la classification n...