Nos travaux sur une nouvelle méthode de classification non supervisée (Germen) nous ont amenés à nous interroger sur la qualité des résultats obtenus. Le problème est d'estimer si une méthode de clustering est 'meilleure' qu'une autre pour le type de données que nous traitons (données textuelles). Dans un premier temps, après avoir fait un état de l'art des méthodes existantes, nous avons appliqué quelques indices de qualité aux résultats de clustering issus de notre algorithme Germen ainsi que d'autres algorithmes communément utilisés. Ces indices de qualité ne permettant pas de sélectionner la meilleure partition, nous avons développé une nouvelle série d'indices basés sur la distribution des mots-clés. Nous présentons et discutons les ré...
Le clustering est une tâche fondamentale de la fouille de données. Ces dernières années, le volume d...
National audienceLe clustering est une tâche essentielle en analyse de données. La variété des métho...
Ce mémoire présente un système de classification automatique floue basé sur des relations probabilis...
National audienceNos travaux sur une nouvelle méthode de classification non supervisée (Germen) nous...
La majorité des algorithmes de clustering souffrent du problème de détermination du nombre de cluste...
International audienceLa classification automatique des documents textes arabes devient nécessaire à...
International audienceNous présentons une approche alternative pour l'évaluation de la qualité de cl...
Cette thèse à publication propose d'étudier deux problématiques différentes : 1) la classification n...
International audienceÀ l'ère dite du "Big Data", les données manipulées ont fortement changées, typ...
International audienceCet article présente une méthode permettant de détecter efficacement des clust...
Au cours des dernières années, la classification à base de clustering s’est imposée comme un sujet d...
Voir : http://editions-rnti.fr/?inprocid=1001932National audienceLa recherche de groupes non-disjoin...
National audienceLe clustering sous contraintes utilisateur a connu un essor important en fouille de...
La différence entre les méthodes de classi cation et les méthodes de cluster- ing réside dans le fa...
L’algorithme des K-moyennes prédictives est un des algorithmes de clustering prédictif visant à décr...
Le clustering est une tâche fondamentale de la fouille de données. Ces dernières années, le volume d...
National audienceLe clustering est une tâche essentielle en analyse de données. La variété des métho...
Ce mémoire présente un système de classification automatique floue basé sur des relations probabilis...
National audienceNos travaux sur une nouvelle méthode de classification non supervisée (Germen) nous...
La majorité des algorithmes de clustering souffrent du problème de détermination du nombre de cluste...
International audienceLa classification automatique des documents textes arabes devient nécessaire à...
International audienceNous présentons une approche alternative pour l'évaluation de la qualité de cl...
Cette thèse à publication propose d'étudier deux problématiques différentes : 1) la classification n...
International audienceÀ l'ère dite du "Big Data", les données manipulées ont fortement changées, typ...
International audienceCet article présente une méthode permettant de détecter efficacement des clust...
Au cours des dernières années, la classification à base de clustering s’est imposée comme un sujet d...
Voir : http://editions-rnti.fr/?inprocid=1001932National audienceLa recherche de groupes non-disjoin...
National audienceLe clustering sous contraintes utilisateur a connu un essor important en fouille de...
La différence entre les méthodes de classi cation et les méthodes de cluster- ing réside dans le fa...
L’algorithme des K-moyennes prédictives est un des algorithmes de clustering prédictif visant à décr...
Le clustering est une tâche fondamentale de la fouille de données. Ces dernières années, le volume d...
National audienceLe clustering est une tâche essentielle en analyse de données. La variété des métho...
Ce mémoire présente un système de classification automatique floue basé sur des relations probabilis...