This thesis was motivated by correlation issues in real datasets, in particular industrialdatasets. The main idea stands in explicit modeling of the correlations between covariatesby a structure of sub-regressions, that simply is a system of linear regressions betweenthe covariates. It points out redundant covariates that can be deleted in a pre-selectionstep to improve matrix conditioning without significant loss of information and withstrong explicative potential because this pre-selection is explained by the structure ofsub-regressions, itself easy to interpret.An algorithm to find the sub-regressions structure inherent to the dataset is provided,based on a full generative model and using Monte-Carlo Markov Chain (MCMC) method.This pre-t...
Cette thèse propose une contribution originale au domaine de la classification de variables en régre...
La description des co-variations entre plusieurs variables aléatoires observées est un problème déli...
Dans cette thèse nous nous intéressons aux problèmes de la sélection de variables en régression liné...
Les travaux effectués durant cette thèse ont pour but de pallier le problème des corrélations au sei...
International audienceRésumé. La régression linéaire est pénalisée par l'usage de variables explicat...
Linear regression outcomes (estimates, prevision) are known to be damaged by highly correlated covar...
High redundancy of explanatory variables results in identification troubles and a severe lack of sta...
High redundancy of explanatory variables results in identification troubles and a severe lack of sta...
Une forte redondance des variables explicatives cause de gros problèmes d'identifiabilité et d'insta...
Les données à haut-débit, par leur grande dimension et leur hétérogénéité, ont motivé le développeme...
Les données à haut-débit, par leur grande dimension et leur hétérogénéité, ont motivé le développeme...
Dans le contexte de la modélisation aléatoire des événements récurrents, un modèle statistique parti...
La modélisation par équations structurelles est très répandue dans des domaines très variés et nous ...
En réponse à la collecte croissante de données, l'analyse statistique représente une réelle opportun...
The statistical analysis of growing masses of data represents a real added value for numerous and va...
Cette thèse propose une contribution originale au domaine de la classification de variables en régre...
La description des co-variations entre plusieurs variables aléatoires observées est un problème déli...
Dans cette thèse nous nous intéressons aux problèmes de la sélection de variables en régression liné...
Les travaux effectués durant cette thèse ont pour but de pallier le problème des corrélations au sei...
International audienceRésumé. La régression linéaire est pénalisée par l'usage de variables explicat...
Linear regression outcomes (estimates, prevision) are known to be damaged by highly correlated covar...
High redundancy of explanatory variables results in identification troubles and a severe lack of sta...
High redundancy of explanatory variables results in identification troubles and a severe lack of sta...
Une forte redondance des variables explicatives cause de gros problèmes d'identifiabilité et d'insta...
Les données à haut-débit, par leur grande dimension et leur hétérogénéité, ont motivé le développeme...
Les données à haut-débit, par leur grande dimension et leur hétérogénéité, ont motivé le développeme...
Dans le contexte de la modélisation aléatoire des événements récurrents, un modèle statistique parti...
La modélisation par équations structurelles est très répandue dans des domaines très variés et nous ...
En réponse à la collecte croissante de données, l'analyse statistique représente une réelle opportun...
The statistical analysis of growing masses of data represents a real added value for numerous and va...
Cette thèse propose une contribution originale au domaine de la classification de variables en régre...
La description des co-variations entre plusieurs variables aléatoires observées est un problème déli...
Dans cette thèse nous nous intéressons aux problèmes de la sélection de variables en régression liné...