Les travaux effectués durant cette thèse ont pour but de pallier le problème des corrélations au sein des bases de données, particulièrement fréquentes dans le cadre industriel. Une modélisation explicite des corrélations par un système de sous-régressions entre covariables permet de pointer les sources des corrélations et d'isoler certaines variables redondantes. Il en découle une pré-sélection de variables sans perte significative d'information et avec un fort potentiel explicatif (la structure de sous-régression est explicite et simple). Un algorithme MCMC (Monte-Carlo Markov Chain) de recherche de structure de sous-régressions est proposé, basé sur un modèle génératif complet sur les données. Ce prétraitement ne dépend pas de la variabl...
La croissance des arbres est supposée être principalement le résultat de trois composantes : (i) une...
Cette thèse contient deux sujets indépendants. Dans la première partie, on considère une situation q...
National audienceNous présentons ici une étude de cas sur la modélisation de l'intensité des forces ...
This thesis was motivated by correlation issues in real datasets, in particular industrialdatasets. ...
International audienceRésumé. La régression linéaire est pénalisée par l'usage de variables explicat...
Une forte redondance des variables explicatives cause de gros problèmes d'identifiabilité et d'insta...
International audienceA l'origine, la Régression Linéaire Généralisée sur Composantes Supervisées (S...
L'étude porte sur la modélisation des événements récurrents d'un système réparable avec maintenances...
La modélisation par équations structurelles est très répandue dans des domaines très variés et nous ...
International audienceUne forte redondance des variables explicatives cause de gros problèmes d'iden...
Cette thèse s'intéresse à des approches factorielles et probabilistes de la covariance qui tient com...
Dans le contexte de la modélisation aléatoire des événements récurrents, un modèle statistique parti...
En réponse à la collecte croissante de données, l'analyse statistique représente une réelle opportun...
De nouvelles technologies, notamment les puces à adn, multiplient la quantité de données disponibles...
Au cours de la dernière décennie, les techniques d’apprentissage automatique ont connu de formidable...
La croissance des arbres est supposée être principalement le résultat de trois composantes : (i) une...
Cette thèse contient deux sujets indépendants. Dans la première partie, on considère une situation q...
National audienceNous présentons ici une étude de cas sur la modélisation de l'intensité des forces ...
This thesis was motivated by correlation issues in real datasets, in particular industrialdatasets. ...
International audienceRésumé. La régression linéaire est pénalisée par l'usage de variables explicat...
Une forte redondance des variables explicatives cause de gros problèmes d'identifiabilité et d'insta...
International audienceA l'origine, la Régression Linéaire Généralisée sur Composantes Supervisées (S...
L'étude porte sur la modélisation des événements récurrents d'un système réparable avec maintenances...
La modélisation par équations structurelles est très répandue dans des domaines très variés et nous ...
International audienceUne forte redondance des variables explicatives cause de gros problèmes d'iden...
Cette thèse s'intéresse à des approches factorielles et probabilistes de la covariance qui tient com...
Dans le contexte de la modélisation aléatoire des événements récurrents, un modèle statistique parti...
En réponse à la collecte croissante de données, l'analyse statistique représente une réelle opportun...
De nouvelles technologies, notamment les puces à adn, multiplient la quantité de données disponibles...
Au cours de la dernière décennie, les techniques d’apprentissage automatique ont connu de formidable...
La croissance des arbres est supposée être principalement le résultat de trois composantes : (i) une...
Cette thèse contient deux sujets indépendants. Dans la première partie, on considère une situation q...
National audienceNous présentons ici une étude de cas sur la modélisation de l'intensité des forces ...