Pour répondre aux problématiques engendrées par la diffusion de plus en plus massive des corpus linguistiques et à l’hétérogénéité de leurs formats, nous proposons une méthode permettant de prendre en main des corpus langagiers oraux et de les convertir dans un format permettant leur exploitation outillée. Pour cette recherche, le corpus ESLO nous sert d’exemple par sa licence de diffusion, son format, son volume et ses atouts sociolinguistiques et diachroniques. Notre travail se fonde sur la compilation de ce corpus pour le rendre compatible avec l’outil de textométrie TXM. Nous opérons un ensemble de transformations des données pour l’utiliser au mieux. Enfin, pour illustrer les apports de ces avancées méthodologiques, nous proposons une ...
International audienceL'analyse de données textuelles est désormais admise comme partenaire de la li...
Nous examinons ici les schémas lexico-grammaticaux (LG) associés à trois verbes supports (« effectue...
Le Dictionnaire du moyen français est fondé en grande partie sur un vaste corpus informatisé. Le but...
Dans certains domaines de la science, telles la physique ou la psychologie expérimentale, on admet q...
Le travail présenté dans cet article s’inscrit dans une recherche qui a pour but la constitution d’u...
La traduction spécialisée implique des choix qui prennent en compte à la fois la situation de commun...
La traduction spécialisée implique des choix qui prennent en compte à la fois la situation de commun...
La textométrie propose une approche et des outils pour analyser les corpus numériques, que les cherc...
L’annotation des corpus oraux présente des défis particuliers, liés aux caractéristiques de la langu...
La textométrie propose une approche et des outils pour analyser les corpus numériques, que les cherc...
L’objectif de cet article est de présenter une méthode d’acquisition, d’organisation et d’interrogat...
L’annotation des corpus oraux présente des défis particuliers, liés aux caractéristiques de la langu...
Nous discutons de la nécessité de tenir compte de la polysémie nominale pour les systèmes de recherc...
Le statut des corpus a profondément évolué du structuralisme jusqu’à l’émergence de la sociolinguist...
L’usage de corpus n’est pas réservé aux linguistes. Néanmoins ceux-ci en sont des utilisateurs paten...
International audienceL'analyse de données textuelles est désormais admise comme partenaire de la li...
Nous examinons ici les schémas lexico-grammaticaux (LG) associés à trois verbes supports (« effectue...
Le Dictionnaire du moyen français est fondé en grande partie sur un vaste corpus informatisé. Le but...
Dans certains domaines de la science, telles la physique ou la psychologie expérimentale, on admet q...
Le travail présenté dans cet article s’inscrit dans une recherche qui a pour but la constitution d’u...
La traduction spécialisée implique des choix qui prennent en compte à la fois la situation de commun...
La traduction spécialisée implique des choix qui prennent en compte à la fois la situation de commun...
La textométrie propose une approche et des outils pour analyser les corpus numériques, que les cherc...
L’annotation des corpus oraux présente des défis particuliers, liés aux caractéristiques de la langu...
La textométrie propose une approche et des outils pour analyser les corpus numériques, que les cherc...
L’objectif de cet article est de présenter une méthode d’acquisition, d’organisation et d’interrogat...
L’annotation des corpus oraux présente des défis particuliers, liés aux caractéristiques de la langu...
Nous discutons de la nécessité de tenir compte de la polysémie nominale pour les systèmes de recherc...
Le statut des corpus a profondément évolué du structuralisme jusqu’à l’émergence de la sociolinguist...
L’usage de corpus n’est pas réservé aux linguistes. Néanmoins ceux-ci en sont des utilisateurs paten...
International audienceL'analyse de données textuelles est désormais admise comme partenaire de la li...
Nous examinons ici les schémas lexico-grammaticaux (LG) associés à trois verbes supports (« effectue...
Le Dictionnaire du moyen français est fondé en grande partie sur un vaste corpus informatisé. Le but...