Résumé. De nombreux travaux en Traduction Automatique Statistique (TAS) pour des langues d’en-trée morphologiquement riches montrent que la ségmentation morphologique et la normalisation orthogra-phique améliorent la qualité des traductions en diminuant la sparsité des données. Dans cet article, nous étudions l’impact de ce prétraitement pour la TAS vers une langue de sortie riche morphologiquement, comme l’Arabe. Nous explorons l’espace des schémas de segmentation et des options de normalisation possibles. Nous évaluons seulement la sortie sous une forme désegmentée et enrichie orthographiquement. Nos résultats montrent d’une part que le meilleur schéma pour la ségmentation est celui de la Penn Arabic Treebank. D’autre part, la meilleure p...
In recent years, the use of morphological decomposition strategies for Arabic Automatic Speech Recog...
Deux problématiques se croisent dans nos travaux de recherches, ils ne font pas parties du même doma...
We present four techniques for online handling of Out-of-Vocabulary words in Phrasebased Statistical...
In this paper, we study the effect of different word-level preprocessing decisions for Arabic on SMT...
Statistical machine translation is quite robust when it comes to the choice of input representation....
In this paper, we report on a set of ini-tial results for English-to-Arabic Statistical Machine Tran...
In statistical machine translation, data sparsity is a challenging problem espe-cially for languages...
This is an accepted manuscript of an article published by Elsevier BV in Computer Speech & Language ...
This paper is interested in improving the quality of Arabic-English statistical machine translation ...
We present a novel morphological analysis technique which induces a morphological and syntactic sym...
Translating from English into a morphologically richer language like Arabic is a challenge in statis...
Inflected languages in a low-resource set-ting present a data sparsity problem for statistical machi...
National audienceG-LexAr est un analyseur morphologique de l'arabe qui a récemment reçu des améliora...
Arabic segmentation was already applied successfully for the task of statistical machine translation...
La traduction automatique des documents est considérée comme l’une des tâches les plus difficiles en...
In recent years, the use of morphological decomposition strategies for Arabic Automatic Speech Recog...
Deux problématiques se croisent dans nos travaux de recherches, ils ne font pas parties du même doma...
We present four techniques for online handling of Out-of-Vocabulary words in Phrasebased Statistical...
In this paper, we study the effect of different word-level preprocessing decisions for Arabic on SMT...
Statistical machine translation is quite robust when it comes to the choice of input representation....
In this paper, we report on a set of ini-tial results for English-to-Arabic Statistical Machine Tran...
In statistical machine translation, data sparsity is a challenging problem espe-cially for languages...
This is an accepted manuscript of an article published by Elsevier BV in Computer Speech & Language ...
This paper is interested in improving the quality of Arabic-English statistical machine translation ...
We present a novel morphological analysis technique which induces a morphological and syntactic sym...
Translating from English into a morphologically richer language like Arabic is a challenge in statis...
Inflected languages in a low-resource set-ting present a data sparsity problem for statistical machi...
National audienceG-LexAr est un analyseur morphologique de l'arabe qui a récemment reçu des améliora...
Arabic segmentation was already applied successfully for the task of statistical machine translation...
La traduction automatique des documents est considérée comme l’une des tâches les plus difficiles en...
In recent years, the use of morphological decomposition strategies for Arabic Automatic Speech Recog...
Deux problématiques se croisent dans nos travaux de recherches, ils ne font pas parties du même doma...
We present four techniques for online handling of Out-of-Vocabulary words in Phrasebased Statistical...