Les algorithmes actuels pour la fouille d’ensembles fréquents sont dépassés par l’augmentation des volumes de données. Dans cette thèse nous nous intéressons plus particulièrement aux données transactionnelles (des collections d’ensembles d’objets, par exemple des tickets de caisse) qui contiennent au moins un million de transactions portant sur au moins des centaines de milliers d’objets. Les jeux de données de cette taille suivent généralement une distribution dite en "longue traine": alors que quelques objets sont très fréquents, la plupart sont rares. Ces distributions sont le plus souvent tronquées par les algorithmes de fouille d’ensembles fréquents, dont les résultats ne portent que sur une infime partie des objets disponibles (les p...
International audienceIn this paper, we introduce item-centric mining, a new semantics for mining lo...
Les extrêmes apparaissent dans une grande variété de données. Par exemple,concernant les données hyd...
Cette thèse étudie certains évènements particuliers des carnets d’ordre - les ”trades traversants”. ...
The recent increase of data volumes raises new challenges for itemset mining algorithms. In this the...
Durant ces dernières années, les quantités de données collectées, dans divers domaines d'application...
National audienceLes nouveaux algorithmes basés sur l'utilisation de la fermeture de la connexion de...
Cette thèse est composée de quatre chapitres.Le premier chapitre est une description préliminaire de...
This paper presents a study of the characteristics of transactional databases used in frequent items...
Ces dernières années, les réseaux sont devenus une source importante d’informations dans différents ...
Par nature, le clustering révèle tout son intérêt lorsque le volume des jeux de données augmente con...
International audienceWe introduce TopPI, a new semantics and algorithm designed to mine long-tailed...
Le croisement du phénomène de mondialisation et du développement continu des technologies de l’infor...
Des quantités de données colossalles sont générées quotidiennement. Traiter de grands volumes de don...
Ces dernières années, la popularité croissante des applications, e.g. les expériences scientifiques,...
This thesis addresses the issue of enhancing the scalability of data mining techniques, with specifi...
International audienceIn this paper, we introduce item-centric mining, a new semantics for mining lo...
Les extrêmes apparaissent dans une grande variété de données. Par exemple,concernant les données hyd...
Cette thèse étudie certains évènements particuliers des carnets d’ordre - les ”trades traversants”. ...
The recent increase of data volumes raises new challenges for itemset mining algorithms. In this the...
Durant ces dernières années, les quantités de données collectées, dans divers domaines d'application...
National audienceLes nouveaux algorithmes basés sur l'utilisation de la fermeture de la connexion de...
Cette thèse est composée de quatre chapitres.Le premier chapitre est une description préliminaire de...
This paper presents a study of the characteristics of transactional databases used in frequent items...
Ces dernières années, les réseaux sont devenus une source importante d’informations dans différents ...
Par nature, le clustering révèle tout son intérêt lorsque le volume des jeux de données augmente con...
International audienceWe introduce TopPI, a new semantics and algorithm designed to mine long-tailed...
Le croisement du phénomène de mondialisation et du développement continu des technologies de l’infor...
Des quantités de données colossalles sont générées quotidiennement. Traiter de grands volumes de don...
Ces dernières années, la popularité croissante des applications, e.g. les expériences scientifiques,...
This thesis addresses the issue of enhancing the scalability of data mining techniques, with specifi...
International audienceIn this paper, we introduce item-centric mining, a new semantics for mining lo...
Les extrêmes apparaissent dans une grande variété de données. Par exemple,concernant les données hyd...
Cette thèse étudie certains évènements particuliers des carnets d’ordre - les ”trades traversants”. ...