Machine Learning con tidymodels

Del análisis al modelo predictivo defendible

Ruta para hacer machine learning serio con R: pipeline reproducible, preprocesado sin fugas, cross-validation correcto, tuning honesto y comparación entre modelos.

Para quién es esta ruta

Analistas que ya dominan tidyverse y estadística básica (Rutas 1 y 3) y quieren modelar para predecir, no solo describir. Esta ruta enseña el flujo moderno de ML en R, el ecosistema tidymodels, con buenas prácticas (sin fugas, con CV honesta, con tuning bien hecho) que el sector aplica en producción.

Nota

Antes de empezar: necesitas R, RStudio y tidyverse instalados. Si no, ve a Instalar R, RStudio y tidyverse.

Qué vas a saber hacer al terminar

Estructurar un pipeline de ML reproducible con tidymodels
Hacer preprocesado sin fugas con recipes
Cross-validation correcta y tuning honesto con tune
Comparar varios modelos en paralelo con workflowsets
Interpretar y defender un modelo (no solo entrenarlo)

Estructura

Bloque 1: Fundamentos

Bloque 2: Especificación y workflow

Bloque 3: Optimización y comparación

Bloque 4: Interpretación y cierre

¿Quieres ir más a fondo?

El libro Machine Learning con tidymodels está en preparación. Cuando esté listo, ampliará esta ruta con un caso real de producción, modelos avanzados (XGBoost, ensembles), deployment con vetiver y monitoreo del modelo en producción.