Machine Learning con tidymodels
Del análisis al modelo predictivo defendible
Ruta para hacer machine learning serio con R: pipeline reproducible, preprocesado sin fugas, cross-validation correcto, tuning honesto y comparación entre modelos.
Para quién es esta ruta
Analistas que ya dominan tidyverse y estadística básica (Rutas 1 y 3) y quieren modelar para predecir, no solo describir. Esta ruta enseña el flujo moderno de ML en R, el ecosistema tidymodels, con buenas prácticas (sin fugas, con CV honesta, con tuning bien hecho) que el sector aplica en producción.
Nota
Antes de empezar: necesitas R, RStudio y tidyverse instalados. Si no, ve a Instalar R, RStudio y tidyverse.
Qué vas a saber hacer al terminar
- Estructurar un pipeline de ML reproducible con
tidymodels - Hacer preprocesado sin fugas con
recipes - Cross-validation correcta y tuning honesto con
tune - Comparar varios modelos en paralelo con
workflowsets - Interpretar y defender un modelo (no solo entrenarlo)
Estructura
Bloque 1: Fundamentos
Bloque 2: Especificación y workflow
Bloque 3: Optimización y comparación
Bloque 4: Interpretación y cierre
¿Quieres ir más a fondo?
El libro Machine Learning con tidymodels está en preparación. Cuando esté listo, ampliará esta ruta con un caso real de producción, modelos avanzados (XGBoost, ensembles), deployment con vetiver y monitoreo del modelo en producción.