Robust variable selection for clustering and classification

Gardener, Jordan Arthur

Publication date

January 2019

Publisher

University of British Columbia

Abstract

Variable selection and other dimensionality reduction methods are more important than ever before. Data sets are getting increasingly massive as time goes on. These huge data sets can be cumbersome, or even impossible,to analyse with many methods. This thesis attempts to improve upon an established method of variable selection for clustering and classification by making it robust to outliers. This is done by initializing using a mixture model of contaminated normal distributions. From these contaminated normal distributions, each observation is placed into clustering groups made up of subgroups of good observations and outlier observations. The variable indicating membership to the good observation subgroup can be used as a weight measure ...

Extracted data

We use cookies to provide a better user experience.

Data Protection

Robust variable selection for clustering and classification

Abstract

Extracted data

Robust variable selection for clustering and classification

Abstract

Extracted data

Related items

Related items