El desarrollo de modelos de aprendizaje automático y su aplicación en la medicina han permitido importantes avances en este campo. Sin embargo, el rendimiento de dichos modelos se ve considerablemente perjudicado por la alta dimensionalidad que tienden a presentar los conjuntos de datos utilizados, siendo frecuente que dichos datos consten de cientos de miles o incluso millones de características que los representen. Una alta dimensionalidad no solo aumenta notablemente el coste computacional de estos algoritmos de inteligencia artificial, sino que también puede provocar sobreajustes a los datos con los que se entrena el algoritmo y disminuir su capacidad de generalización, proporcionando inferencias poco precisas. La solución a este proble...