International audienceDéterminer les liens de co-occurrence entre les mots d'un ensemble de textes nécessite le choix d'un empan, c'est à dire d'un découpage en individus statistiques de plus ou moins grande taille : depuis le simple N-gramme (empan glissant de N mots) jusqu'au texte complet, en passant par le virgulot, la phrase, le paragraphe, etc. Ces liens peuvent donner lieu à diverses catégorisations des mots, selon la "focale" utilisée. Notre étude porte sur un corpus d'articles de presse (3 mois de controverses sur les OGM et les perturbateurs endocriniens) auquel nous appliquons 1) notre procédure Morph d'étiquetage morpho-syntactique, de façon à désambiguer, étiqueter et lemmatiser au mieux la séquence des formes présentes, 2) not...
http://taln.limsi.fr/site/talnRecital05/tome1/P18.pdfNous montrons dans cet article qu'une même enti...
International audienceCet article s'intéresse aux modes d'expression de la méronymie dans les petite...
International audienceThis contribution analyses the data model for textometry (for calculations lik...
International audienceDéterminer les liens de co-occurrence entre les mots d'un ensemble de textes n...
International audienceLa traduction des expressions multi-mots pose de sérieux problèmes du fait de ...
Les coocurrences ont surtout servi jusqu’ici à établir les relations, principalement sémantiques, qu...
International audienceThis paper recalls the double constraint of text mining: tokenizing and co(n)t...
National audienceLes disfluences, phénomène propre à l‟oral, ont la particularité de briser la linéa...
International audienceLe recours croissant aux « très grands corpus » en Traitement Automatique des ...
International audienceLes relations entre termes jouent toujours un rôle très important dans la repr...
International audienceLa notion de corpus parallèle comportant plusieurs volets qui correspondent ch...
Dans ce mémoire, nous nous attachons à retracer les différents travaux de recherche que nous avons m...
Cet article décrit une ontologie multilingue de noms propres divisée en deux parties, une partie sup...
International audienceBeing the result of a manual or an automatic annotation procedure, a coreferen...
Numéro thématique dirigé par Benoît HABERT et intitulé :"Dépasser les sens iniques dans l'accès auto...
http://taln.limsi.fr/site/talnRecital05/tome1/P18.pdfNous montrons dans cet article qu'une même enti...
International audienceCet article s'intéresse aux modes d'expression de la méronymie dans les petite...
International audienceThis contribution analyses the data model for textometry (for calculations lik...
International audienceDéterminer les liens de co-occurrence entre les mots d'un ensemble de textes n...
International audienceLa traduction des expressions multi-mots pose de sérieux problèmes du fait de ...
Les coocurrences ont surtout servi jusqu’ici à établir les relations, principalement sémantiques, qu...
International audienceThis paper recalls the double constraint of text mining: tokenizing and co(n)t...
National audienceLes disfluences, phénomène propre à l‟oral, ont la particularité de briser la linéa...
International audienceLe recours croissant aux « très grands corpus » en Traitement Automatique des ...
International audienceLes relations entre termes jouent toujours un rôle très important dans la repr...
International audienceLa notion de corpus parallèle comportant plusieurs volets qui correspondent ch...
Dans ce mémoire, nous nous attachons à retracer les différents travaux de recherche que nous avons m...
Cet article décrit une ontologie multilingue de noms propres divisée en deux parties, une partie sup...
International audienceBeing the result of a manual or an automatic annotation procedure, a coreferen...
Numéro thématique dirigé par Benoît HABERT et intitulé :"Dépasser les sens iniques dans l'accès auto...
http://taln.limsi.fr/site/talnRecital05/tome1/P18.pdfNous montrons dans cet article qu'une même enti...
International audienceCet article s'intéresse aux modes d'expression de la méronymie dans les petite...
International audienceThis contribution analyses the data model for textometry (for calculations lik...