Python para análisis de datos
pandas, numpy y matplotlib desde cero (con guiños a R)
Ruta progresiva para análisis de datos con Python. NumPy, pandas, lectura de datos, groupby, joins, fechas y visualización con matplotlib + seaborn.
Para quién es esta ruta
Dos audiencias distintas:
- Usuarios de R que quieren añadir Python a su caja de herramientas. Conoces tidyverse pero quieres saber qué hacer cuando el código del equipo está en Python.
- Analistas sin R, que prefieren empezar directamente con Python por estar más extendido en ciencia de datos e ingeniería.
La ruta funciona para ambos: empieza desde el entorno, sin asumir Python previo. Para quien viene de R, hay puentes ocasionales con el equivalente tidyverse.
Nota
Antes de empezar: necesitas tener Python 3.10+ instalado (o lo instalaremos en el primer tutorial). Si ya usas R, las dos herramientas conviven sin problema en la misma máquina.
Qué vas a saber hacer al terminar
- Configurar un entorno Python reproducible con
uvy Jupyter - Manipular datos tabulares con
pandas(Series, DataFrame, Index) - Hacer EDA completo: filtros, groupby, joins, reshape, fechas
- Visualizar con
matplotlib+seaborncon calidad publicable
Estructura
Bloque 1: Fundamentos
Bloque 2: Manipulación
Bloque 3: Combinar y reshape
Bloque 4: Visualización y caso completo
¿Quieres ir más a fondo?
El libro pandas para analistas (con guiños a R) está en preparación. Cuando esté listo, ampliará esta ruta con un caso real seguido de principio a fin, comparaciones cuidadosas entre pandas y dplyr/tidyr, y patrones de productividad que evitan las trampas de quien aprende pandas sin guía.