La problématique centrale de ce travail porte sur la catégorisation sémantique non supervisée de mots en arabe basée sur de grands corpus, et tout particulièrement sur l’utilité de l’information grammaticale dans cette catégorisation sémantique. Cette thèse a été entamée pour mener à bien la mise en place d’une méthodologie rigoureuse pour tester l’apport de la structure grammaticale à la catégorisation sémantique et pour l’appliquer sur un grand corpus de quelques milliards de mots.Extraire la structure grammaticale d’un corpus sans connaissance préalable sur la langue se fait ici en étudiant la distribution des patterns constitués par les éléments de haute fréquence au voisinage des éléments de moindre fréquence. Si le corpus est assez gr...
This dissertation aims at classifying verbs in Arabic using syntactic alternations for the purpose ...
12Standard Arabic (SA) is an extremely rich natural language that has unfortunately received very li...
La langue arabe est pauvre en ressources sémantiques électroniques. Il y a bien la ressource Arabic ...
Cette thèse se situe à l’intersection des domaines de la recherche en linguistique et du traitement ...
The model of categorial grammars is a sufficiently flexible model to give an account of several lang...
Le travail présenté ici se situe dans le cadre général d’élaborer une méthodologie de traitement du ...
Cette thèse traite de la description formelle et du développement d’une grammaire électronique de la...
International audienceWe examine the relationship between Arabic grammar and the corpora to explain ...
Arabic language is very rich in derivations, vocabulary, and grammatical structures. The problem of ...
Applications of statistical Arabic NLP in general, and text mining in specific, along with the tools...
Traditionnellement, on distingue trois parties du discours dans la langue arabe à savoir le nom, le ...
Cette thèse porte sur la classification et le traitement des invariants lexicaux arabes qui exprimen...
Cette thèse explique et présente notre démarche de la réalisation d’un système à base de règles de r...
This dissertation studies the various uses of the verb-tool kāna in contemporary Arabic. Part I. We ...
Extended version of a paper presented at ACIT 2017.International audienceSyntactic and semantic reso...
This dissertation aims at classifying verbs in Arabic using syntactic alternations for the purpose ...
12Standard Arabic (SA) is an extremely rich natural language that has unfortunately received very li...
La langue arabe est pauvre en ressources sémantiques électroniques. Il y a bien la ressource Arabic ...
Cette thèse se situe à l’intersection des domaines de la recherche en linguistique et du traitement ...
The model of categorial grammars is a sufficiently flexible model to give an account of several lang...
Le travail présenté ici se situe dans le cadre général d’élaborer une méthodologie de traitement du ...
Cette thèse traite de la description formelle et du développement d’une grammaire électronique de la...
International audienceWe examine the relationship between Arabic grammar and the corpora to explain ...
Arabic language is very rich in derivations, vocabulary, and grammatical structures. The problem of ...
Applications of statistical Arabic NLP in general, and text mining in specific, along with the tools...
Traditionnellement, on distingue trois parties du discours dans la langue arabe à savoir le nom, le ...
Cette thèse porte sur la classification et le traitement des invariants lexicaux arabes qui exprimen...
Cette thèse explique et présente notre démarche de la réalisation d’un système à base de règles de r...
This dissertation studies the various uses of the verb-tool kāna in contemporary Arabic. Part I. We ...
Extended version of a paper presented at ACIT 2017.International audienceSyntactic and semantic reso...
This dissertation aims at classifying verbs in Arabic using syntactic alternations for the purpose ...
12Standard Arabic (SA) is an extremely rich natural language that has unfortunately received very li...
La langue arabe est pauvre en ressources sémantiques électroniques. Il y a bien la ressource Arabic ...