Notre étude se focalise sur l'un des verrous technologiques qui freinent l'industralisation de systèmes fiables de traitement automatique des documents manuscrits: l'analyse automatique de la mise en page. Cette analyse se découpe traditionnellement en deux étapes: l'extraction de la structure physique (segmentation ou découpage de l'image du document en blocs d'information) et l'extraction de la structure logique (reconnaissance ou étiquetage fonctionnel des blocs extraits). Usuellement, ces deux tâches d'extraction sont réalisées séquentiellement. Il apparait pourtant que ces deux structures sont intimement liées et qu'il serait préférable de les extraire simultanément. C'est pourquoi nous proposons dans ce papier un système de segmentati...
International audienceThis work relates to the implementation of a 2D conditional random field model...
International audienceLes documents non structurés contiennent la majeure partie de l’information ut...
Large amounts of communication, documentation as well as knowledge and information are stored in tex...
The automatic processing of written documents is a very active field in the industry. Indeed, due to...
National audienceCette article décrit une nouvelle approche utilisant des Champs Aléatoires Conditio...
National audienceCet article décrit une nouvelle approche utilisant des champs aléatoires conditionn...
16 pagesInternational audienceRÉSUMÉ. Cet article décrit une nouvelle approche utilisant des Champs ...
Dans le cadre du traitement automatique de courriers entrants, nous présentons dans cette thèse l ét...
International audienceNous abordons dans ces travaux le problème de l'extraction de la structure phy...
International audienceThe paper describes a new approach using a Conditional Random Fields (CRFs) to...
Cette thèse traite de la segmentation structurelle de documents issus de cahiers de chimie. Ce trava...
Dans cet article on propose une nouvelle approche pour l'enrichissement des éditions électroniques d...
Cette thèse s'attache à l'étude de la structuration des documents dits à "typographie riche et récur...
National audienceDans cet article nous proposons une nouvelle approche pour l’enrichissement des édi...
[EN] In this paper we define a bidimensional extension of stochastic context-free grammars for struc...
International audienceThis work relates to the implementation of a 2D conditional random field model...
International audienceLes documents non structurés contiennent la majeure partie de l’information ut...
Large amounts of communication, documentation as well as knowledge and information are stored in tex...
The automatic processing of written documents is a very active field in the industry. Indeed, due to...
National audienceCette article décrit une nouvelle approche utilisant des Champs Aléatoires Conditio...
National audienceCet article décrit une nouvelle approche utilisant des champs aléatoires conditionn...
16 pagesInternational audienceRÉSUMÉ. Cet article décrit une nouvelle approche utilisant des Champs ...
Dans le cadre du traitement automatique de courriers entrants, nous présentons dans cette thèse l ét...
International audienceNous abordons dans ces travaux le problème de l'extraction de la structure phy...
International audienceThe paper describes a new approach using a Conditional Random Fields (CRFs) to...
Cette thèse traite de la segmentation structurelle de documents issus de cahiers de chimie. Ce trava...
Dans cet article on propose une nouvelle approche pour l'enrichissement des éditions électroniques d...
Cette thèse s'attache à l'étude de la structuration des documents dits à "typographie riche et récur...
National audienceDans cet article nous proposons une nouvelle approche pour l’enrichissement des édi...
[EN] In this paper we define a bidimensional extension of stochastic context-free grammars for struc...
International audienceThis work relates to the implementation of a 2D conditional random field model...
International audienceLes documents non structurés contiennent la majeure partie de l’information ut...
Large amounts of communication, documentation as well as knowledge and information are stored in tex...