Les corpus bilingues sont des ressources essentielles pour s'affranchir de la barrière de la langue en traitement automatique des langues (TAL) dans un contexte multilingue. La plupart des travaux actuels utilisent des corpus parallèles qui sont surtout disponibles pour des langues majeurs et pour des domaines spécifiques. Les corpus comparables, qui rassemblent des textes comportant des informations corrélées, sont cependant moins coûteux à obtenir en grande quantité. Plusieurs travaux antérieurs ont montré que l'utilisation des corpus comparables est bénéfique à différentes taches en TAL. En parallèle à ces travaux, nous proposons dans cette thèse d'améliorer la qualité des corpus comparables dans le but d'améliorer les performances des a...
Actes des 6es Journées internationales d’Analyse statistique des Données Textuelles, 10-12 mars 2004...
Les performances des systèmes de traduction automatique statistique dépendent de la disponibilité de...
La présente synthèse se déroule en trois temps, qui correspondent peu ou prou à la chronologie des a...
Bilingual corpora are an essential resource used to cross the language barrier in multilingual Natur...
Thematic comparable corpora regroup texts from a same topic and written in several languages, highly...
International audienceWe study in this chapter the problem of measuring the degree of comparability ...
National audienceNous étudions dans cet article le problème de la comparabilité des documents compos...
National audienceThe main work in bilingual lexicon extraction from comparable corpora is based on t...
International audienceThis work is motivated by the will of creating a new part-of-speech annotated ...
Following the pioneering work by (Li and Gaussier, 2010), we address in this paper the analysis of a...
International audienceIn this article, we present a simple and effective approach for extracting bil...
In the presence of bilingual comparable corpora it is natural to embed the data in two distinct ling...
International audienceBilingual lexicon extraction from comparable corpora gives good results for la...
Les corpus comparables rassemblent des textes dans plusieurs langues qui ne sont pas des traductions...
Un corpus comparable est un corpus multilingue qui contient des textes recueillis en utilisant les m...
Actes des 6es Journées internationales d’Analyse statistique des Données Textuelles, 10-12 mars 2004...
Les performances des systèmes de traduction automatique statistique dépendent de la disponibilité de...
La présente synthèse se déroule en trois temps, qui correspondent peu ou prou à la chronologie des a...
Bilingual corpora are an essential resource used to cross the language barrier in multilingual Natur...
Thematic comparable corpora regroup texts from a same topic and written in several languages, highly...
International audienceWe study in this chapter the problem of measuring the degree of comparability ...
National audienceNous étudions dans cet article le problème de la comparabilité des documents compos...
National audienceThe main work in bilingual lexicon extraction from comparable corpora is based on t...
International audienceThis work is motivated by the will of creating a new part-of-speech annotated ...
Following the pioneering work by (Li and Gaussier, 2010), we address in this paper the analysis of a...
International audienceIn this article, we present a simple and effective approach for extracting bil...
In the presence of bilingual comparable corpora it is natural to embed the data in two distinct ling...
International audienceBilingual lexicon extraction from comparable corpora gives good results for la...
Les corpus comparables rassemblent des textes dans plusieurs langues qui ne sont pas des traductions...
Un corpus comparable est un corpus multilingue qui contient des textes recueillis en utilisant les m...
Actes des 6es Journées internationales d’Analyse statistique des Données Textuelles, 10-12 mars 2004...
Les performances des systèmes de traduction automatique statistique dépendent de la disponibilité de...
La présente synthèse se déroule en trois temps, qui correspondent peu ou prou à la chronologie des a...