National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur limitant la performance des systèmes de Reconnaissance d’Entités Nommées (REN). Les systèmes de REN sont en effet généralement entraînés sur des données « propres », non-bruitées, ce qui n’est pas le cas des données des humanités numériques obtenues par reconnaissance optique de caractères (OCR). De fait, la qualité des transcriptions OCR est souvent perçue comme la source principale des erreurs faites par les outils de REN. Cependant, des résultats obtenus avec différents systèmes REN sur des transcriptions OCR d’un corpus du 19ème siècle (ELTeC) tendent à montrer une certaine robustesse, modulo la présence de formes bruitées, parfois dites «...
Cet article aborde la reconnaissance d'entités nommées (NER) appliquée aux textes historiques obtenu...
International audienceLes transcriptions automatiques de parole constituent une ressource importante...
International audienceLes transcriptions automatiques de parole constituent une ressource importante...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
Au cours de la parole spontanée, les locuteurs produisent beaucoup de formes réduites de mots. Ils n...
Au cours de la parole spontanée, les locuteurs produisent beaucoup de formes réduites de mots. Ils n...
Cet article aborde la reconnaissance d'entités nommées (NER) appliquée aux textes historiques obtenu...
International audienceLes transcriptions automatiques de parole constituent une ressource importante...
International audienceLes transcriptions automatiques de parole constituent une ressource importante...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
National audienceLa variation dans les données textuelles, en particulier le bruit, est un facteur l...
Au cours de la parole spontanée, les locuteurs produisent beaucoup de formes réduites de mots. Ils n...
Au cours de la parole spontanée, les locuteurs produisent beaucoup de formes réduites de mots. Ils n...
Cet article aborde la reconnaissance d'entités nommées (NER) appliquée aux textes historiques obtenu...
International audienceLes transcriptions automatiques de parole constituent une ressource importante...
International audienceLes transcriptions automatiques de parole constituent une ressource importante...