Cette thèse présente un modèle de construction automatique et approximatif de la représentation du sens d'un texte. On adapte des techniques de documentation automatique à des bases documentaires non indexées. Les techniques classiques reposent sur une indexation vectorielle. Chaque document est représenté par un descripteur, on définit une distance entre ces descripteurs. L'accès aux documents pertinents est basé sur des calculs de proximité entre ces descripteurs. Une structuration du domaine, couvert par des documents, est obtenue par une classification (en anglais « clustering ») faisant apparaître des thèmes sémantiques. Il faut améliorer les techniques en leur permettant de traiter les documents non indexés, en améliorant les résultat...
International audiencedu lot » : l'extraction d'information, Iris Eshkol, Université d'Orléans et Je...
ISBN 2-7462-0610-2Les entreprises et les particuliers sont confrontés à une masse d'information sans...
L'extraction d'information non supervisée en domaine ouvert est une évolution récente de l'extractio...
Les travaux menés dans le cadre de cette thèse se situent dans la problématique de recherche- indexa...
Un résumé est un texte reformulé dans un espace plus réduit. Il doit exprimer avec un minimum de mot...
La classification de documents textuels est une tâche relativement ancienne. Très tôt, de nombreux d...
L'intégration de l'information syntaxique dans la représentation vectorielle des documents s'est avé...
Stratégie d'indexation automatique de textes en langue naturelle. Intérêts aux aspects structurels d...
La classification automatique de textes était jusqu'à présent employée pour l'indexation documentair...
CETTE THESE ABORDE LE THEME D'EXPLOITATION AUTOMATIQUE DE L'INFORMATION TEXTUELLE DANS UN PROCESSUS ...
Les systèmes d'analyse sémantique reposent le plus souvent sur des analyses locales du texte tandis ...
National audienceDans de nombreux domaines (e.g., fouille de données, entrepôts de données), l'exist...
National audienceLes méthodes dédiées à l'extraction automatique de thématiques sont issues de domai...
International audienceL'annotation sémantique et automatique de corpus scientifiques permet de produ...
International audienceLes documents non structurés contiennent la majeure partie de l’information ut...
International audiencedu lot » : l'extraction d'information, Iris Eshkol, Université d'Orléans et Je...
ISBN 2-7462-0610-2Les entreprises et les particuliers sont confrontés à une masse d'information sans...
L'extraction d'information non supervisée en domaine ouvert est une évolution récente de l'extractio...
Les travaux menés dans le cadre de cette thèse se situent dans la problématique de recherche- indexa...
Un résumé est un texte reformulé dans un espace plus réduit. Il doit exprimer avec un minimum de mot...
La classification de documents textuels est une tâche relativement ancienne. Très tôt, de nombreux d...
L'intégration de l'information syntaxique dans la représentation vectorielle des documents s'est avé...
Stratégie d'indexation automatique de textes en langue naturelle. Intérêts aux aspects structurels d...
La classification automatique de textes était jusqu'à présent employée pour l'indexation documentair...
CETTE THESE ABORDE LE THEME D'EXPLOITATION AUTOMATIQUE DE L'INFORMATION TEXTUELLE DANS UN PROCESSUS ...
Les systèmes d'analyse sémantique reposent le plus souvent sur des analyses locales du texte tandis ...
National audienceDans de nombreux domaines (e.g., fouille de données, entrepôts de données), l'exist...
National audienceLes méthodes dédiées à l'extraction automatique de thématiques sont issues de domai...
International audienceL'annotation sémantique et automatique de corpus scientifiques permet de produ...
International audienceLes documents non structurés contiennent la majeure partie de l’information ut...
International audiencedu lot » : l'extraction d'information, Iris Eshkol, Université d'Orléans et Je...
ISBN 2-7462-0610-2Les entreprises et les particuliers sont confrontés à une masse d'information sans...
L'extraction d'information non supervisée en domaine ouvert est une évolution récente de l'extractio...