National audienceNotre objectif est d'automatiser la construction de corpus comparables spécialisés à partir du Web. La comparabilité se base sur trois niveaux : le domaine, le thème et le type de discours. Le domaine et le thème peuvent être filtrés grâce aux mots-clés utilisés lors de la recherche. Nous présentons dans cet article la reconnaissance automatique du type de discours dans des documents spécialisés français et japonais, qui nécessite une analyse linguistique poussée. Une analyse contrastive des documents nous permet de déterminer quelles informations paraissent discriminantes. En s'inspirant des travaux classiques de recherche d'information, nous créons une typologie robuste et linguistiquement motivée basée sur trois niveaux ...
Thematic comparable corpora regroup texts from a same topic and written in several languages, highly...
International audienceCet article étudie la propriété de comparabilité, trop souvent prise comme une...
National audienceLes corpus multilingues sont exploités dans plusieurs branches du traitement automa...
Les corpus comparables rassemblent des textes dans plusieurs langues qui ne sont pas des traductions...
International audienceL'objectif principal de notre travail consiste à étudier la notion de comparab...
International audienceWe present in this paper the development of a specialized comparable corpora c...
Version disponible sur Internet : [ http://www.univ-rouen.fr/dyalang/glottopol/numero_8.html ]L'acqu...
International audienceEn s’appuyant sur une étude comparative des démonstratifs français et chinois ...
International audienceThis work is motivated by the will of creating a new part-of-speech annotated ...
Le traitement de la crise économique par les agences de presse française (AFP) et espagnole (EFE) po...
International audienceDe nos jours, la classification automatique de textes est en passe de devenir ...
La présente synthèse se déroule en trois temps, qui correspondent peu ou prou à la chronologie des a...
Cette communication présente une approche instrumentée du traitement médiatique de l'information dan...
Un corpus comparable est un corpus multilingue qui contient des textes recueillis en utilisant les m...
Thematic comparable corpora regroup texts from a same topic and written in several languages, highly...
International audienceCet article étudie la propriété de comparabilité, trop souvent prise comme une...
National audienceLes corpus multilingues sont exploités dans plusieurs branches du traitement automa...
Les corpus comparables rassemblent des textes dans plusieurs langues qui ne sont pas des traductions...
International audienceL'objectif principal de notre travail consiste à étudier la notion de comparab...
International audienceWe present in this paper the development of a specialized comparable corpora c...
Version disponible sur Internet : [ http://www.univ-rouen.fr/dyalang/glottopol/numero_8.html ]L'acqu...
International audienceEn s’appuyant sur une étude comparative des démonstratifs français et chinois ...
International audienceThis work is motivated by the will of creating a new part-of-speech annotated ...
Le traitement de la crise économique par les agences de presse française (AFP) et espagnole (EFE) po...
International audienceDe nos jours, la classification automatique de textes est en passe de devenir ...
La présente synthèse se déroule en trois temps, qui correspondent peu ou prou à la chronologie des a...
Cette communication présente une approche instrumentée du traitement médiatique de l'information dan...
Un corpus comparable est un corpus multilingue qui contient des textes recueillis en utilisant les m...
Thematic comparable corpora regroup texts from a same topic and written in several languages, highly...
International audienceCet article étudie la propriété de comparabilité, trop souvent prise comme une...
National audienceLes corpus multilingues sont exploités dans plusieurs branches du traitement automa...