Metagenómica con DADA2 y phyloseq

Del FASTQ al análisis diferencial publicable, todo en R/Bioconductor

Ruta progresiva para análisis de microbioma 16S en R con DADA2, phyloseq y herramientas modernas (ANCOM-BC, MaAsLin2). Énfasis en interpretación honesta, decisiones biológicas y un caso real seguido de principio a fin.

Para quién es esta ruta

Bioinformáticos, biólogos y profesionales de la salud que ya manejan R y quieren llevar a cabo análisis de microbioma 16S con un flujo moderno de Bioconductor. La ruta asume familiaridad con secuenciación masiva (mapeo, QC) pero no exige experiencia previa con DADA2, phyloseq ni con análisis composicional.

Si has hecho la ruta de RNA-seq con Bioconductor, parte del bagaje ya lo tienes: SummarizedExperiment, manejo de Bioconductor y el patrón de “contenedor + análisis + diagnóstico”. El microbioma añade su propia capa de sutileza: composicionalidad, diversidad ecológica y un problema biológico distinto.

Nota

Antes de empezar: necesitas R y RStudio. Si no, ve a Instalar R, RStudio y tidyverse. La instalación específica de paquetes Bioconductor para microbioma la cubrimos en el primer bloque.

Qué vas a saber hacer al terminar

  • Decidir entre amplicón 16S y shotgun según la pregunta biológica
  • Procesar reads amplicón con DADA2: QC, denoising, merge, quimeras y asignación taxonómica con SILVA
  • Construir y manipular objetos phyloseq (ASV + metadata + taxonomía + árbol filogenético)
  • Calcular y reportar diversidad alfa (Shannon, Simpson, Chao1) y beta (Bray-Curtis, UniFrac, PCoA, NMDS, PERMANOVA)
  • Aplicar análisis diferencial composicional con ANCOM-BC y MaAsLin2
  • Producir un informe Quarto reproducible con el flujo completo

Estructura

Bloque 1: Fundamentos

  1. Metagenómica: qué se mide, por qué importa
  2. Técnicas: 16S amplicón vs shotgun
  3. De muestra a FASTQ + bases de datos públicas
  4. Setup Bioconductor para microbioma

Bloque 2: Pipeline DADA2 en R

  1. QC y filtrado de reads amplicón
  2. Learn errors + denoising
  3. Merge pairs + remoción de quimeras
  4. Asignación taxonómica con SILVA

Bloque 3: Análisis con phyloseq

  1. phyloseq: contenedor y composición taxonómica
  2. Diversidad alfa: Shannon, Simpson, Chao1
  3. Diversidad beta y ordenaciones (PCoA, NMDS, UniFrac)

Bloque 4: Caso completo

  1. Caso completo: ANCOM-BC + informe Quarto

Anexo

A. QIIME2: alternativa Python/CLI para amplicón


¿Quieres ir más a fondo?

El libro Metagenómica con DADA2 y phyloseq: del FASTQ al informe está en preparación. Cuando esté listo, ampliará esta ruta con casos multi-cohorte, manejo de batch effects, normalización composicional avanzada (CLR, ILR), integración con metadata clínica y un informe corporativo final reproducible de extremo a extremo.