Version préliminaire soumise au comité scientifique et retenue sans modificationInternational audienceIntertextual distance provides a simple and interesting solution to measure proximities and oppositions in large text corpora. Its properties make it a good tool for text classification, and especially for tree-analysis which is presented and discussed in this paper. In order to measure the quality of this classification, two indices are proposed. The method presented provides an accurate tool for literary studies and authorship attribution - as is demonstrated by its application to a blind test.La distance intertextuelle fournit une solution simple et intéressante pour mesurer les proximités et les oppositions dans un grand corpus de texte...
18 pagesInternational audienceIn the 2001, Volume 8, Number 3, issue of the Journal of Quantitative ...
International audienceLe présent exposé tente d'explorer et de comparer les méthodes qu'on a proposé...
Les distances textuelles permettent d'évaluer et de représenter la proximité ou l'éloignement entre ...
Version préliminaire soumise au comité scientifique et retenue sans modificationInternational audien...
How to measure proximities and oppositions in large text corpora? Intertextual distance provides a s...
International audienceHow to measure proximities and oppositions in large text corpora? Intertextual...
With the collaboration of J. Savoy, a corpus has been compiled in order to test the methods of autho...
The purpose of this paper is to test and to compare various methods used by the statistical analyses...
Version française préliminaire à la traduction anglaise acceptée par le Journal of Quantitative Ling...
Le test du Khi-2 de Pearson est probablement le test statistique le plus populaire en linguistique d...
International audienceHow can it be said that texts are "near to" or "distant from" one another? Are...
version anglaise préliminaire à l'article paru sous ce titre dans le Journal of Quantitative Linguis...
International audienceComment identifier l'auteur d'un texte d'origine douteuse ou inconnue ? Dans l...
This study proposes a thematic research method using statistics (a probabilistic test) : it is appli...
The distribution of a word in a collection of texts (corpus) is the set of locations where this term...
18 pagesInternational audienceIn the 2001, Volume 8, Number 3, issue of the Journal of Quantitative ...
International audienceLe présent exposé tente d'explorer et de comparer les méthodes qu'on a proposé...
Les distances textuelles permettent d'évaluer et de représenter la proximité ou l'éloignement entre ...
Version préliminaire soumise au comité scientifique et retenue sans modificationInternational audien...
How to measure proximities and oppositions in large text corpora? Intertextual distance provides a s...
International audienceHow to measure proximities and oppositions in large text corpora? Intertextual...
With the collaboration of J. Savoy, a corpus has been compiled in order to test the methods of autho...
The purpose of this paper is to test and to compare various methods used by the statistical analyses...
Version française préliminaire à la traduction anglaise acceptée par le Journal of Quantitative Ling...
Le test du Khi-2 de Pearson est probablement le test statistique le plus populaire en linguistique d...
International audienceHow can it be said that texts are "near to" or "distant from" one another? Are...
version anglaise préliminaire à l'article paru sous ce titre dans le Journal of Quantitative Linguis...
International audienceComment identifier l'auteur d'un texte d'origine douteuse ou inconnue ? Dans l...
This study proposes a thematic research method using statistics (a probabilistic test) : it is appli...
The distribution of a word in a collection of texts (corpus) is the set of locations where this term...
18 pagesInternational audienceIn the 2001, Volume 8, Number 3, issue of the Journal of Quantitative ...
International audienceLe présent exposé tente d'explorer et de comparer les méthodes qu'on a proposé...
Les distances textuelles permettent d'évaluer et de représenter la proximité ou l'éloignement entre ...