Les modèles d'espace vectoriels mettant en œuvre l'analyse distributionnelle s'appuient sur la redondance d'informations se trouvant dans le contexte des mots à associer. Cependant, ces modèles souffrent du nombre de dimensions considérable et de la dispersion des données dans la matrice des vecteurs de contexte. Il s'agit d'un enjeu majeur sur les corpus de spécialité pour lesquels la taille est beaucoup plus petite et les informations contextuelles moins redondantes. Nous nous intéressons au problème de la dispersion des données sur des corpus de spécialité et proposons une méthode permettant de densifier la matrice en généralisant les contextes distributionnels. L'évaluation de la méthode sur un corpus médical en français montre qu'avec ...
Communication affichée, présentée le 17 juin 2005 au 2ème Colloque Jeunes Chercheurs du Laboratoire ...
National audienceLa Système d'Information Résif-SI est une action transverse de l'Infrastructure de ...
Dans le domaine de l'énergie électrique, trois problèmes importants se posent: le problème de produc...
Les modèles d'espace vectoriels mettant en œuvre l'analyse distributionnelle s'appuient sur la redon...
International audienceLes approches qui reposent sur l'hypothèse distributionnelle ont pour point co...
International audienceLes modèles de langue sont au coeur de nombreux de travaux, notamment dans les...
Dans les domaines de spécialité, les applications telles que la recherche d’information ou la traduc...
National audienceMême si les modèles de langue contextuels sont aujourd’hui dominants en traitement ...
In specialised domains, the applications such as information retrieval for machine translation rely ...
National audienceLes méthodes automatiques fondées sur une approche distributionnelle du sens connai...
La communication propose de réfléchir à la manière dont on peut mobiliser, en géographes, un matéria...
Dans cette thèse, nous étudions différents aspects liés à la localité des algorithmes distribués. D'...
International audienceLes mesures de similarité textuelle ont une place importante en TAL, du fait d...
National audienceDans une société qui fonctionne de plus en plus sur des bases numériques, les donné...
Partant du constat que le traitement divergent d'unités lexicales dans divers dictionnaires révèle d...
Communication affichée, présentée le 17 juin 2005 au 2ème Colloque Jeunes Chercheurs du Laboratoire ...
National audienceLa Système d'Information Résif-SI est une action transverse de l'Infrastructure de ...
Dans le domaine de l'énergie électrique, trois problèmes importants se posent: le problème de produc...
Les modèles d'espace vectoriels mettant en œuvre l'analyse distributionnelle s'appuient sur la redon...
International audienceLes approches qui reposent sur l'hypothèse distributionnelle ont pour point co...
International audienceLes modèles de langue sont au coeur de nombreux de travaux, notamment dans les...
Dans les domaines de spécialité, les applications telles que la recherche d’information ou la traduc...
National audienceMême si les modèles de langue contextuels sont aujourd’hui dominants en traitement ...
In specialised domains, the applications such as information retrieval for machine translation rely ...
National audienceLes méthodes automatiques fondées sur une approche distributionnelle du sens connai...
La communication propose de réfléchir à la manière dont on peut mobiliser, en géographes, un matéria...
Dans cette thèse, nous étudions différents aspects liés à la localité des algorithmes distribués. D'...
International audienceLes mesures de similarité textuelle ont une place importante en TAL, du fait d...
National audienceDans une société qui fonctionne de plus en plus sur des bases numériques, les donné...
Partant du constat que le traitement divergent d'unités lexicales dans divers dictionnaires révèle d...
Communication affichée, présentée le 17 juin 2005 au 2ème Colloque Jeunes Chercheurs du Laboratoire ...
National audienceLa Système d'Information Résif-SI est une action transverse de l'Infrastructure de ...
Dans le domaine de l'énergie électrique, trois problèmes importants se posent: le problème de produc...