Dans cette thèse, qui s'inscrit dans le contexte général de la recherche d'information sur la Toile, nous abordons le problème de l'indexation (thématique et non thématique) des pages. En particulier, nous nous interessons à leur typologie. Nous proposons une méthode de caractérisation des pages comprenant deux étapes. La première, l'extraction de corpus homogènes, vise à rapprocher des pages partageant des caractéristiques communes. La seconde, l'affectation semi-automatique de métadonnées au sein de chaque corpus homogène, est basée sur la propagation : au départ, seule une faible proportion des ressources sont qualifiées manuellement, leurs informations sont ensuite propagées aux autres ressources. Au niveau méthodologique, l'extraction ...
Le besoin en information est primordial pour la recherche et la veille scientifiques et techniques. ...
International audienceDans cet article, nous montrons que les non-voyants ne peuvent accéder à toute...
Les techniques actuelles d'indexation sur le Web ne sont pas satisfaisantes pour les ressources péda...
In this thesis, which is part and parcel of the more general context of web information retrieval, w...
ISBN 2-906855-18-9Web resources are more and more different, not only regarding thematic content but...
International audienceLes auteurs qui publient sur le Web des connaissances sous la forme de documen...
L'explosion du Web représente un nouveau défi pour la recherche d'information (RI). La plupart des s...
The Web is a huge source of information, and one of the main problems facing users is finding docume...
Deux types d'outils de recherche sont actuellement utilisés pour aider l'utilisateur à trouver des i...
Cette thèse porte sur l'indexation et l'interrogation de pages Web. Dans ce cadre, nous proposons un...
National audienceIntroductionBien que les méthodes d'indexation de pages Web se soient notablement a...
In a hypertext documents are seldom composed of a set of nodes instead of a single one. The informat...
L'analyse et la fouille des données d'usages sont indissociables de la notion d'évolution dynamique....
Les techniques actuelles d'indexation sur le Web ne sont pas satisfaisantes pour les ressources péda...
Le document papier est un objet complexe et multiforme, porteur d'informations à plusieurs niveaux. ...
Le besoin en information est primordial pour la recherche et la veille scientifiques et techniques. ...
International audienceDans cet article, nous montrons que les non-voyants ne peuvent accéder à toute...
Les techniques actuelles d'indexation sur le Web ne sont pas satisfaisantes pour les ressources péda...
In this thesis, which is part and parcel of the more general context of web information retrieval, w...
ISBN 2-906855-18-9Web resources are more and more different, not only regarding thematic content but...
International audienceLes auteurs qui publient sur le Web des connaissances sous la forme de documen...
L'explosion du Web représente un nouveau défi pour la recherche d'information (RI). La plupart des s...
The Web is a huge source of information, and one of the main problems facing users is finding docume...
Deux types d'outils de recherche sont actuellement utilisés pour aider l'utilisateur à trouver des i...
Cette thèse porte sur l'indexation et l'interrogation de pages Web. Dans ce cadre, nous proposons un...
National audienceIntroductionBien que les méthodes d'indexation de pages Web se soient notablement a...
In a hypertext documents are seldom composed of a set of nodes instead of a single one. The informat...
L'analyse et la fouille des données d'usages sont indissociables de la notion d'évolution dynamique....
Les techniques actuelles d'indexation sur le Web ne sont pas satisfaisantes pour les ressources péda...
Le document papier est un objet complexe et multiforme, porteur d'informations à plusieurs niveaux. ...
Le besoin en information est primordial pour la recherche et la veille scientifiques et techniques. ...
International audienceDans cet article, nous montrons que les non-voyants ne peuvent accéder à toute...
Les techniques actuelles d'indexation sur le Web ne sont pas satisfaisantes pour les ressources péda...