La tâche de segmentation et de regroupement en locuteur (SRL) consiste à déterminer le nombre de locuteurs ainsi que leurs interventions dans un document audio. Cette tâche intéresse de nombreuses entreprises qui souhaitent indexer leurs contenus audiovisuels. En particulier, l'institut national de l'audiovisuel (INA) désire appliquer cette tâche sur ses archives afin d'en améliorer l'accessibilité mais également l'annotation.Cependant, les usages de l'institut requièrent une qualité minimum qui n'est, la plupart du temps, pas encore atteinte par les systèmes automatiques de SRL à l'état de l'art.Pour atteindre les performances voulues, un humain peut corriger la sortie d'un système de SRL. Néanmoins, une intervention humaine est généraleme...
International audienceWe propose to study speaker diarization from a collection of audio documents. ...
International audienceThis paper presents the ELISA consortium activities in automatic speaker diari...
Audio diarization is the process of annotating an input audio channel with information that attribut...
International audienceDans cet article, nous présentons un simulateur dédié à l'évaluation des corre...
La tâche de Segmentation et Regroupement en Locuteurs (SRL), telle que définie par le NIST, considèr...
La segmentation et regroupement en locuteurs (SRL) de collection cherche à répondre à la question « ...
The ever-expanding volume of available audio and multimedia data has elevated technologies related t...
Le traitement automatique de la parole est un domaine qui englobe un grand nombre de travaux : de la...
Face au volume croissant de données audio et multimédia, les technologies liées à l'indexation de do...
The task of speaker diarization and linking aims at answering the question "who speaks and when?" in...
La motivation de cette thèse est de développer des méthodologies et des algorithmes qui utilisent l'...
Cette thèse est consacrée à l élaboration et l évaluation des techniques visant à renforcer la robus...
L'identité des personnes dans les documents audiovisuels représente une information sémantique impor...
Le traitement automatique de la parole est un domaine qui englobe un grand nombre de travaux : de la...
International audienceThis paper presents a semi-automatic approach to create a diachronic corpus of...
International audienceWe propose to study speaker diarization from a collection of audio documents. ...
International audienceThis paper presents the ELISA consortium activities in automatic speaker diari...
Audio diarization is the process of annotating an input audio channel with information that attribut...
International audienceDans cet article, nous présentons un simulateur dédié à l'évaluation des corre...
La tâche de Segmentation et Regroupement en Locuteurs (SRL), telle que définie par le NIST, considèr...
La segmentation et regroupement en locuteurs (SRL) de collection cherche à répondre à la question « ...
The ever-expanding volume of available audio and multimedia data has elevated technologies related t...
Le traitement automatique de la parole est un domaine qui englobe un grand nombre de travaux : de la...
Face au volume croissant de données audio et multimédia, les technologies liées à l'indexation de do...
The task of speaker diarization and linking aims at answering the question "who speaks and when?" in...
La motivation de cette thèse est de développer des méthodologies et des algorithmes qui utilisent l'...
Cette thèse est consacrée à l élaboration et l évaluation des techniques visant à renforcer la robus...
L'identité des personnes dans les documents audiovisuels représente une information sémantique impor...
Le traitement automatique de la parole est un domaine qui englobe un grand nombre de travaux : de la...
International audienceThis paper presents a semi-automatic approach to create a diachronic corpus of...
International audienceWe propose to study speaker diarization from a collection of audio documents. ...
International audienceThis paper presents the ELISA consortium activities in automatic speaker diari...
Audio diarization is the process of annotating an input audio channel with information that attribut...