Tema
RDA 3 T2
Instrucciones
Carga y procesamiento:
Usa un dataset multivariado real, cómo:
- Breast Cancer Wisconsin
- Dataset de vinos
- Dataset propio del área de interés (salud, finanzas, telecomunicaciones, etc)
Realiza limpieza básica: valores faltantes, encoding de categorías si las hubiera y escalado
Selección y transformación de features
Aplica 2 métodos diferentes de selección de features, por ejemplo:
- SelectKBest con test estadístico
- Recursive Feature Elimination (RFE)
- Feature Importance basada en modelos
Realiza una transformación de features (PCA o alguna otra técnica de reducción de dimensionalidad) y compara:
- ¿Cuántas componentes explican el 95% de la varianza?
- ¿Cómo cambia el desempeño del modelo al usar PCA?