Metagenómica: qué se mide, por qué importa
La idea
La metagenómica estudia comunidades microbianas leyendo su material genético directamente del ambiente, sin cultivar nada. La pregunta no es qué microorganismo crece en una placa. La pregunta es qué microorganismos hay en una muestra, en qué proporción, y qué pueden hacer.
La consecuencia importante: accedemos a la fracción no cultivable del microbioma. La microbiología clásica solo veía lo que crecía en agar. Hoy estimamos que más del 99 % de los microorganismos del planeta no se cultivan rutinariamente. La metagenómica abrió esa puerta.
Tres preguntas, tres respuestas
Una muestra (heces, suelo, agua de mar, biofilm) responde a tres preguntas distintas según cómo se secuencie:
| Pregunta | Cómo se contesta |
|---|---|
| ¿Quién está? | Composición taxonómica (16S, ITS, 18S) |
| ¿Qué hace? | Composición funcional (shotgun, metatranscriptómica) |
| ¿Cómo se compara con otra? | Diversidad alfa/beta + análisis diferencial |
Esta ruta se centra en ¿quién está? vía 16S amplicón, el flujo más maduro, reproducible y barato. El ¿qué hace? (shotgun + análisis funcional) lo tocamos brevemente en el siguiente tutorial y a fondo en el libro.
Metagenómica vs otras ómicas
Comparada con sus vecinas:
| Ómica | Qué mide | Sample típico |
|---|---|---|
| Genómica clásica | Genoma de un organismo aislado | Cepa pura cultivada |
| Transcriptómica (RNA-seq) | Expresión de genes de un organismo | Tejido / línea celular |
| Metagenómica 16S | Composición taxonómica de una comunidad | Heces, suelo, agua |
| Metagenómica shotgun | Composición taxonómica + funcional | Heces, suelo, agua |
| Metatranscriptómica | RNA de la comunidad (qué se expresa) | Misma comunidad, fresca |
| Metaproteómica | Proteínas presentes | Misma comunidad |
Diferencia clave: en RNA-seq la unidad de análisis es el gen dentro de un genoma conocido. En metagenómica 16S la unidad es la secuencia variable de un gen marcador (rRNA 16S) que identifica el organismo. El “qué hace” no se mide directamente, se infiere de quién está, con todos los matices que eso lleva.
¿Por qué 16S?
El gen del RNA ribosómico 16S está en todas las bacterias y arqueas. Tiene:
- Regiones conservadas: permiten diseñar primers universales que amplifican el gen en cualquier bacteria.
- Regiones hipervariables (V1-V9): diferentes entre especies → identifican el organismo.
Secuenciando una o dos regiones hipervariables (V3-V4 es lo más común) tenemos un “DNA barcode” por bacteria. Con eso reconstruimos quién está y en qué proporción.
Para hongos se usa ITS (Internal Transcribed Spacer). Para eucariotas en general, 18S. La filosofía es la misma: un gen marcador con regiones conservadas + variables.
¿Qué responde y qué no responde?
Sí responde:
- ¿La composición microbiana cambia entre dos grupos? (caso-control, antes-después).
- ¿Hay un microorganismo asociado a una condición clínica?
- ¿La diversidad bacteriana de una muestra es menor que la de otra?
- ¿Qué taxones explican la variación entre comunidades?
No responde directamente (necesita más datos):
- ¿Qué genes funcionales están activos? → requiere metatranscriptómica.
- ¿Qué cepas concretas hay dentro de una especie? → resolución insuficiente del 16S. Necesita shotgun + binning.
- ¿La bacteria X causa la condición Y? → asociación ≠ causalidad. Requiere intervención.
- ¿Cuántos virus / fagos hay? → 16S es para bacterias y arqueas. Los virus necesitan otra estrategia (virómica).
Aplicaciones reales
El campo es enorme. Cuatro frentes donde tiene impacto clínico/industrial demostrado:
- Salud humana: enfermedad inflamatoria intestinal, obesidad, diabetes, eje microbiota-cerebro, respuesta a inmunoterapia oncológica. El Human Microbiome Project (HMP) caracterizó 18 sitios corporales en cientos de personas sanas. Es el dataset de referencia.
- Agricultura: microbioma del suelo y su relación con productividad, microbiota rizosférica, fijación de nitrógeno. El Earth Microbiome Project (EMP) hizo lo mismo a escala planetaria con suelos, agua y aire.
- Industria y biotecnología: probióticos, fermentación, biorremediación, microbioma fármaco-modulador.
- Wellness y consumo: skincare microbiome, productos basados en bacterias probióticas, kits de microbioma intestinal personales.
Proyectos canónicos como referencia
Cuatro datasets que vale la pena conocer porque aparecen en todo paper de microbioma:
- HMP (Human Microbiome Project, NIH): la referencia para microbioma humano sano.
- EMP (Earth Microbiome Project): biogeografía microbiana global. ~ 27 000 muestras.
- MGnify (EBI): pipeline + datos procesados para metagenómica diversa.
- American Gut Project / British Gut: ciencia ciudadana, miles de muestras de heces con metadata estilo de vida.
Todos son públicos y reanalizables. En el tutorial 3 veremos cómo descargar reads de SRA / MGnify para empezar tu propio análisis sin esperar a secuenciar nada.
El gen 16S en práctica
Resumen visual de cómo se ve la lectura en un análisis amplicón:
Bacteria → DNA → PCR con primers universales → amplicón de la región variable
(~250-460 bp para V3-V4)
↓ secuenciar Illumina paired-end
↓
Reads FASTQ
↓ DADA2 (lo veremos)
↓
ASVs (Amplicon Sequence Variants)
+ tabla taxonómica
+ tabla abundancia por muestra
El output útil para análisis es una tabla ASV × muestra con conteos, más la asignación taxonómica de cada ASV. Equivale al gene × sample de RNA-seq, pero la unidad biológica es distinta.
ASV vs OTU: la guerra de la última década
Si lees papers de hace 5+ años verás OTUs (Operational Taxonomic Units). Eran clusters de secuencias con ≥ 97 % de identidad, agrupadas como aproximación a “especie”.
Hoy se usan ASVs (Amplicon Sequence Variants). Son secuencias exactas, sin clustering. Ventajas:
- Resolución mayor: distinguen variantes con ≥ 1 nucleótido de diferencia.
- Reproducibles: la misma muestra procesada en dos labs da los mismos ASVs. Los OTUs dependían del clustering, que dependía del dataset.
- Comparables entre estudios: dos ASVs idénticos de papers distintos son literalmente el mismo organismo.
DADA2, el pipeline que usamos en esta ruta, produce ASVs. Es el estándar moderno. Si encuentras tutoriales con OTUs (pick_otus, usearch), están desactualizados pero los conceptos son trasladables.
Trampas habituales
- Confundir “abundancia” con “número absoluto”. Los datos de microbioma son composicionales: el total siempre suma 1 (o 100 % o el tamaño de la librería). No sabes si hubo 10⁶ o 10⁹ bacterias reales. Esto tiene consecuencias estadísticas serias y motiva análisis composicional (CLR, ANCOM-BC). Lo veremos a fondo en el tutorial 12.
- Sobreinterpretar el 16S. Resuelve hasta género y, con suerte, especie. No distingue cepas. Si tu pregunta es “¿esta cepa probiótica concreta colonizó el intestino?”, necesitas shotgun + assembly + binning.
- Comparar studios con regiones distintas. V3-V4 y V4 producen ASVs no comparables entre sí. Misma especie, secuencias diferentes. Diseña con la misma región o reconcilia vía taxonomía.
- Pensar que más diversidad = mejor microbioma. Eso lo veremos en el tutorial 10. Spoiler: depende del contexto.
En la siguiente entrega
Has fijado los conceptos. La siguiente entrega es la decisión técnica que más condiciona todo lo demás: 16S amplicón vs shotgun. Cuándo cada una, qué resolución te da, qué cuesta, y por qué esta ruta se centra en amplicón. Lo siguiente.