Bases de datos de metabolismo

Referencias químicas, repositorios experimentales y modelos metabólicos

databases
metabolomics
metabolism
cheminformatics
pathways
gem
Catálogo comentado de las bases de datos que estructuran el trabajo en metabolómica y metabolismo de sistemas: referencias químicas (ChEBI, HMDB, LipidMaps), repositorios experimentales (MetaboLights, METLIN), rutas y reacciones (KEGG, MetaCyc) y modelos a escala genómica (Recon3D, VMH).

Sobre bases de datos de metabolismo

El ecosistema de recursos para metabolismo es heterogéneo y suele confundirse en literatura. Conviene separar tres familias antes de elegir herramienta:

  • Referencias químicas. Catálogos de compuestos con estructura, identificadores y propiedades fisicoquímicas. Aquí entran ChEBI (ontología química curada en el EBI), HMDB (metaboloma humano centrado en biología) y LipidMaps (nomenclatura y clasificación de lípidos). Son el sistema de coordenadas: si tu salida no se reconcilia contra uno de estos identificadores, no será integrable con otras bases.
  • Repositorios de datos experimentales. Estudios y espectros depositados por la comunidad. MetaboLights (EBI) es el equivalente a GEO/SRA para metabolómica. METLIN (Scripps) es la mayor librería de espectros MS/MS de referencia. Aquí buscas datos, no anotaciones canónicas.
  • Rutas, reacciones y modelos a escala genómica. KEGG (Compound + Reaction + Pathway) y MetaCyc son los catálogos curados de reacciones bioquímicas. Recon3D y la Virtual Metabolic Human (VMH) son reconstrucciones del metabolismo humano en formato SBML, usadas para análisis estructural (FBA, COBRA).

Tres principios prácticos:

  • El identificador manda. Cualquier integración seria empieza por mapear todo a un sistema canónico. ChEBI suele ser el pivote más estable. InChIKey actúa como huella estructural cuando ChEBI no cubre el compuesto.
  • Estructura ≠ medida. Una entrada de HMDB no implica que el compuesto haya sido medido en tu matriz biológica. La anotación experimental siempre requiere espectros de referencia (METLIN, MoNA, HMDB experimental) o estándares internos.
  • Modelos no son bases de datos. Recon3D y VMH son representaciones matemáticas con estequiometría completa: útiles para FBA y análisis de redes, no para anotar metabolitos sueltos.

El orden de la página refleja esta jerarquía: referencias químicas → repositorios experimentales → rutas y reacciones → modelos.


ChEBI

ChEBI (Chemical Entities of Biological Interest) es la ontología química curada manualmente por el EMBL-EBI. Combina nomenclatura química rigurosa, estructura 2D/3D, jerarquía ontológica (relaciones is_a, has_role, has_part) y vínculos cruzados a UniProt, KEGG, MetaCyc, Rhea y Reactome. Es el identificador canónico de referencia en el ecosistema EBI y la elección por defecto para mapear metabolitos entre fuentes.

Su valor diferencial está en la ontología: ChEBI distingue entre la entidad química (molecular entity) y su rol funcional (inhibitor, cofactor, xenobiotic), lo que permite consultas semánticas sobre clases enteras de compuestos (p. ej. “todos los flavonoides anotados como antioxidantes”).

Qué incluye

  • Más de 200.000 entidades químicas curadas, con un subconjunto “3-star” verificado manualmente.
  • Estructura en SMILES, InChI e InChIKey. Fórmula, masa monoisotópica, carga formal.
  • Jerarquía ontológica navegable y vínculos a literatura primaria (PubMed, IUPAC).
  • Cross-references a KEGG Compound, HMDB, LipidMaps, MetaCyc, PubChem, ChEMBL.

Cuándo usarla

  • Como identificador pivote cuando integras múltiples fuentes (metabolómica + transcriptómica + farmacología).
  • Para consultas basadas en clase química o rol biológico (subgrafos ontológicos).
  • Cuando trabajas dentro del ecosistema EBI (Reactome, Rhea, ChEMBL): ChEBI es nativo allí.

Cuándo NO usarla

  • Anotación de espectros MS. ChEBI no almacena espectros experimentales. Necesitas METLIN, MoNA o HMDB.
  • Cobertura de lípidos compleja. Aunque tiene lípidos, LipidMaps es más exhaustivo en nomenclatura estructural (sn-position, niveles LIPID MAPS).
  • Compuestos sintéticos / fármacos en desarrollo. Para esos, PubChem y ChEMBL son más amplios.

Conceptos clave

  • InChIKey como huella estructural: una cadena de 27 caracteres derivada del InChI completo, ideal para lookup y deduplicación entre bases.
  • Nivel de curación (stars). 3-star indica curación manual completa. Entradas con menos estrellas pueden provenir de importaciones automáticas.
  • Roles ontológicos. Una entidad puede tener múltiples has_role (un compuesto puede ser simultáneamente antioxidant y EC inhibitor). Permite consultas multidimensionales.
  • SMILES vs InChI. SMILES es legible y compacto pero no canónico salvo que se normalice. InChI es canónico por definición y preferible como clave entre sistemas.

Cómo se accede

Limitaciones / cobertura

  • Cobertura sesgada hacia compuestos de relevancia biológica. Menor en química industrial o de síntesis.
  • El ritmo de curación manual es lento. Entradas recientes pueden tener 2-star con vínculos incompletos.
  • No incluye espectros experimentales ni datos de concentración fisiológica.

Enlaces

Relacionadas en esta página

  • HMDB, referencia química con foco en metaboloma humano y datos cuantitativos.
  • LipidMaps, para nomenclatura y clasificación específica de lípidos.
  • KEGG Compound y MetaCyc, referencias químicas asociadas a reacciones y rutas.

HMDB

HMDB (Human Metabolome Database) es la referencia para el metaboloma humano, mantenida por el grupo de David Wishart en la Universidad de Alberta. Combina la lógica de una referencia química (estructura, identificadores) con anotaciones específicamente biológicas: concentraciones fisiológicas en fluidos y tejidos, asociaciones a enfermedades, rutas KEGG/SMPDB, y un repositorio de espectros experimentales (MS y NMR).

A diferencia de ChEBI, HMDB no aspira a cubrir toda la química: se centra en metabolitos detectables o esperables en el cuerpo humano. Es la base estándar al anotar estudios de metabolómica clínica.

Qué incluye

  • ~220.000 entradas (incluyendo predichas), con un subconjunto curado manualmente de varios miles.
  • Estructura, InChI, InChIKey, fórmula, masa monoisotópica.
  • Concentraciones de referencia en plasma, orina, LCR, saliva, heces (rango fisiológico y patológico).
  • Espectros experimentales: MS, MS/MS, 1H-NMR, 13C-NMR, en distintas condiciones.
  • Asociaciones a enfermedades (disease references) y a vías metabólicas (SMPDB, KEGG).
  • Cross-refs a ChEBI, KEGG, METLIN, FoodDB, DrugBank.

Cuándo usarla

  • Anotación de metabolómica humana (plasma, orina, biopsias).
  • Verificación de plausibilidad biológica de una identificación (¿se ha reportado este metabolito en esta matriz?).
  • Lookup de concentraciones de referencia para putative ID y para diseño de método.
  • Búsqueda de espectros experimentales por m/z o por estructura.

Cuándo NO usarla

  • Organismos no humanos. Existen variantes (YMDB para levadura, ECMDB para E. coli), pero la cobertura es desigual. Para humano + ratón, considera también MMMDB.
  • Identificador canónico universal. HMDB IDs son específicos del proyecto. Para integración multi-base, usa ChEBI o InChIKey como pivote.
  • Cobertura de lípidos compleja. Para lipidómica, LipidMaps es el referente.

Conceptos clave

  • HMDB ID (HMDB0000001): identificador estable, pero específico de HMDB. No es universal.
  • Predicted vs experimental. Una fracción importante de las entradas tiene estructura predicha y/o espectros simulados (no medidos). Compruébalo siempre en la pestaña Origin y en MS Spectra (experimental vs predicted).
  • MoNA (MassBank of North America). HMDB enlaza con MoNA. Cuando necesites espectros experimentales auditables, MoNA suele ser más explícita en metadatos de adquisición.
  • SMPDB (Small Molecule Pathway Database) es la versión propia de rutas mantenida por el mismo grupo. Útil pero menos canónica que KEGG o Reactome.

Cómo se accede

  • Web: https://hmdb.ca/
  • Descargas XML completas (~varias GB) y SDF: https://hmdb.ca/downloads
  • Búsqueda por m/z, fórmula, estructura (subestructura, similitud).
  • En R: el paquete metabolomicsWorkbenchR y webchem cubren parte del lookup. Para descargas masivas, parseo del XML.

Limitaciones / cobertura

  • Mezcla entradas curadas y predichas. Sin filtrar, sobreestima cobertura real.
  • Algunas concentraciones provienen de un único estudio: úsalas como orden de magnitud, no como referencia poblacional.
  • Versionado del XML no siempre granular: documenta la versión descargada en tus análisis.

Enlaces

Relacionadas en esta página

  • ChEBI, identificador pivote recomendado para integración.
  • METLIN, librería de espectros MS/MS complementaria.
  • MetaboLights, repositorio de datos crudos. HMDB sirve para anotar features de esos estudios.

LipidMaps

LipidMaps es el consorcio internacional de referencia para nomenclatura, clasificación y estructura de lípidos. Coordinado por la LIPID MAPS Lipidomics Gateway (UC San Diego), define el sistema de clasificación jerárquica que usa hoy la práctica totalidad de la lipidómica seria: ocho categorías principales (FA, GL, GP, SP, ST, PR, SL, PK), divididas en clases, subclases y especies moleculares.

Su contribución más relevante no es solo el catálogo (LMSD, LIPID MAPS Structure Database), sino la convención de nomenclatura (PC 36:1, PC 18:0_18:1, PC 18:0/18:1) y los niveles de anotación (especie sumarizada, especie molecular, sn-position resolvida), que permiten comunicar con precisión cuán resuelta es una identificación.

Qué incluye

  • LMSD: ~47.000 estructuras de lípidos curadas con identificador LMxxxxxxxx.
  • Nomenclatura sistemática y abreviada estandarizada (recomendaciones LIPID MAPS 2020/2024).
  • Herramientas online: LIPID MAPS Tools para predicción de fragmentos MS, cálculo de masa, búsqueda por fórmula y por similitud estructural.
  • Cross-refs a ChEBI, HMDB, KEGG, SwissLipids.

Cuándo usarla

  • Cualquier estudio de lipidómica: anotación, normalización de nomenclatura, validación de identificaciones.
  • Cuando necesites distinguir niveles de resolución (PC 36:1 vs PC 18:0_18:1 vs PC 18:0/18:1).
  • Para lookup sistemático de masas exactas y fragmentación esperada.

Cuándo NO usarla

  • Concentraciones fisiológicas o asociaciones a enfermedad. Para eso, HMDB o SwissLipids complementan.
  • Espectros MS/MS experimentales completos. LipidMaps ofrece predicciones de fragmentación. Para espectros experimentales auditables, METLIN, MoNA o las librerías comerciales (Lipidblast, MS-DIAL).
  • Lípidos exóticos o de organismos específicos. Cobertura sesgada hacia humano y modelos clásicos.

Conceptos clave

  • Niveles de anotación. Especie sumarizada (PC 36:1, solo C totales:dobles enlaces), especie molecular (PC 18:0_18:1, composición de cadenas sin sn-position), especie con sn-position (PC 18:0/18:1). Reportar al nivel correcto evita sobreinterpretación.
  • Categorías: FA (ácidos grasos), GL (glicerolípidos), GP (glicerofosfolípidos), SP (esfingolípidos), ST (esteroles), PR (prenol), SL (sacarolípidos), PK (policétidos).
  • Identificador LM (LMGP01010001): codifica categoría/clase/subclase en el propio ID, lo que facilita parseo programático.
  • Convención de delimitadores (_ para nivel desconocido sn, / para sn-resuelto). Mezclarlos en una misma tabla es bandera roja en revisión.

Cómo se accede

Limitaciones / cobertura

  • Cobertura limitada en lípidos de plantas, microbianos y poliméricos.
  • Nomenclatura evoluciona: estudios antiguos pueden usar convenciones obsoletas. LipidLynxX ayuda a normalizar.
  • No incluye datos cuantitativos poblacionales.

Enlaces

Relacionadas en esta página

  • ChEBI y HMDB, referencias químicas generales. LipidMaps domina la parte lipídica.
  • METLIN, espectros experimentales que se anotan con nomenclatura LipidMaps.

MetaboLights

MetaboLights es el repositorio público de datos crudos de metabolómica del EMBL-EBI. Es el equivalente, en su dominio, a GEO o ArrayExpress en transcriptómica: aloja experimentos completos con archivos crudos (Thermo .raw, Bruker, Agilent .d, mzML, mzData), metadatos en formato ISA-Tab, descripciones de protocolos y resultados procesados.

Coordinado por el EBI desde 2012, es el repositorio recomendado por las principales revistas para datos de metabolómica humana, vegetal y microbiana. Su valor está en la reproducibilidad: cada estudio (MTBLSxxxx) trae el i_Investigation.txt, los s_Sample.txt y a_assay.txt, lo que permite reconstruir el diseño experimental completo.

Qué incluye

  • Miles de estudios depositados con datos crudos y/o procesados.
  • Metadatos en ISA-Tab (investigación / estudio / assay).
  • Archivos brutos en formatos vendor-specific y mzML / nmrML.
  • Tablas de metabolitos anotados (m_metabolite.tsv).
  • Vínculos a publicaciones primarias.

Cuándo usarla

  • Reanálisis de datos públicos para validar un método o un hallazgo.
  • Cumplimiento de requisitos editoriales: depositar antes de publicar.
  • Benchmarking de pipelines (XCMS, MS-DIAL) contra estudios bien anotados.
  • Búsqueda de estudios por matriz, organismo, técnica (LC-MS, GC-MS, NMR).

Cuándo NO usarla

  • Anotación de metabolitos canónica. MetaboLights almacena lo que el autor depositó. No es una referencia química curada. Usa ChEBI / HMDB / LipidMaps.
  • Espectros de referencia. Para librerías MS/MS curadas, METLIN o MoNA.
  • Datos clínicos longitudinales con metadatos profundos. ISA-Tab cubre lo experimental, no el seguimiento clínico ampliado.

Conceptos clave

  • ISA-Tab. Estándar tabular para experimentos ómicos (Investigation / Study / Assay). Tres archivos planos que estructuran metadatos. Lectura y validación con isatools (Python) o R Risa.
  • MTBLS ID (MTBLS123): identificador estable del estudio. Citable y persistente.
  • mzML / nmrML. Formatos abiertos basados en XML para espectros de MS y NMR respectivamente. La conversión desde formatos propietarios se hace con msconvert (ProteoWizard) o Aspera.
  • Niveles de identificación (MSI): los estudios deben declarar el nivel de confianza (1 = estándar autentificado, 2 = match contra librería, 3 = clase tentativa, 4 = desconocido). Comprueba este nivel antes de reusar anotaciones.

Cómo se accede

Limitaciones / cobertura

  • Calidad de metadatos heterogénea entre estudios. Los antiguos a menudo carecen de m_metabolite.tsv.
  • Volumen total considerable: planifica almacenamiento si descargas estudios completos.
  • La cobertura geográfica está sesgada hacia Europa y Norteamérica.

Enlaces

Relacionadas en esta página

  • HMDB y ChEBI, referencias para anotar metabolitos identificados en estudios MetaboLights.
  • METLIN, librería espectral que da soporte a las identificaciones depositadas.

METLIN

METLIN es la librería de espectros MS/MS más extensa para metabolómica no dirigida, mantenida por el Scripps Center for Metabolomics (grupo de Gary Siuzdak). Combina un catálogo de compuestos con espectros experimentales adquiridos en condiciones controladas a múltiples energías de colisión (CE) y polaridades, lo que la hace especialmente útil para anotación de features en LC-MS/MS.

Es estándar de facto en muchos laboratorios de metabolómica. Rivaliza con MoNA, MassBank y NIST en cobertura, con la diferencia de que METLIN es operada por un único grupo con criterios homogéneos de adquisición.

Qué incluye

  • Cientos de miles de compuestos con espectros experimentales y/o predichos (in silico vía METLIN Neural Network).
  • Espectros MS/MS a múltiples CE (típicamente 0, 10, 20, 40 eV) en positivo y negativo.
  • METLIN Gen2 y desarrollos recientes incorporan predicción de espectros vía deep learning para compuestos sin datos experimentales.
  • Información cruzada con KEGG, HMDB, ChEBI.

Cuándo usarla

  • Anotación de features MS/MS en estudios untargeted.
  • Comparación de espectros experimentales propios contra una librería de referencia con CE conocidas.
  • Lookup por m/z y patrón de fragmentación.

Cuándo NO usarla

  • Datos GC-MS con EI clásica. Para 70 eV EI, NIST y GMD (Golm Metabolome Database) son referentes.
  • Datos NMR. Usa HMDB o bases NMR específicas.
  • Cuantificación poblacional. METLIN no almacena concentraciones de referencia.

Conceptos clave

  • Match score. La similitud espectral típica usa dot product (coseno) sobre vectores de m/z alineados. Valores >0.7 con varios picos diagnósticos son razonables. Reporta siempre el método y el umbral.
  • CE-dependent fragmentation. Un mismo compuesto fragmenta de forma muy distinta a 10 eV vs 40 eV. Para anotación seria, compara contra el espectro de tu CE real.
  • In silico vs experimental. Los espectros predichos (METLIN NN y similares) son útiles para descartar candidatos, pero no sustituyen a un experimental para identificación nivel MSI 2.
  • Acceso de pago. El acceso completo a METLIN requiere licencia institucional. El modo público es limitado.

Cómo se accede

Limitaciones / cobertura

  • Acceso parcialmente cerrado: la versión pública no expone todos los espectros.
  • Calidad de los espectros predichos depende del modelo y del compuesto. Siempre tratarlos como hipótesis.
  • Sesgo hacia compuestos de interés clínico/farmacológico.

Enlaces

Relacionadas en esta página

  • HMDB, referencia química con espectros propios complementarios.
  • MetaboLights, repositorio de estudios cuyos features se anotan contra METLIN.

KEGG Compound / Reaction / Pathway

KEGG (Kyoto Encyclopedia of Genes and Genomes) integra genes, enzimas, reacciones, compuestos y rutas en un único grafo curado por el Kanehisa Laboratories desde 1995. Para el dominio metabólico, las tres entidades relevantes son KEGG Compound (catálogo de moléculas), KEGG Reaction (reacciones bioquímicas con estequiometría) y KEGG Pathway (mapas curados de rutas).

KEGG es el recurso de referencia para pathway enrichment clásico y para mapeo gen-enzima-reacción. Su limitación más conocida es la licencia restringida desde 2011: el acceso vía FTP requiere suscripción comercial, y el uso programático masivo está limitado.

Qué incluye

  • KEGG Compound (C00031, etc.): ~19.000 metabolitos curados con estructura, fórmula y vínculos a reacciones.
  • KEGG Reaction (R00001): reacciones balanceadas con compuestos sustrato/producto y EC numbers.
  • KEGG Pathway (map00010, glucólisis): mapas curados, navegables en SVG, con superposición opcional de datos.
  • KEGG Orthology (KO) y vínculos a genomas para mapeo gen → función.
  • Cross-refs a ChEBI, PubChem, HMDB.

Cuándo usarla

  • Pathway enrichment clásico (gprofiler, clusterProfiler enrichKEGG, fgsea sobre KEGG sets).
  • Mapeo gen → enzima → reacción → compuesto en un único grafo.
  • Visualización con pathview (R) o el visor web KEGG.

Cuándo NO usarla

  • Modelos a escala genómica para FBA. KEGG describe reacciones pero no es un GEM ejecutable. Para FBA, usa Recon3D o VMH.
  • Cobertura de reacciones más allá de lo curado. Para rutas no canónicas o variantes específicas de organismo, MetaCyc suele ser más exhaustiva.
  • Uso programático sin licencia. El acceso al FTP completo requiere suscripción. Respeta los términos.

Conceptos clave

  • Identificadores estables por entidad (C compuestos, R reacciones, K ortólogos, map rutas, ec EC numbers).
  • KEGG Mapper y pathview (R) superponen fold-changes sobre los mapas oficiales.
  • KGML. Formato XML que representa los mapas como grafos. Consumible por KEGGgraph y pathview.
  • Licencia. Uso académico vía web y API REST limitada es libre. Descargas masivas y comercial requieren suscripción a KEGG FTP.

Cómo se accede

  • Web: https://www.kegg.jp/
  • API REST: https://rest.kegg.jp/ (rate-limited, sin autenticación para uso académico moderado).
  • En R: KEGGREST (consultas REST), pathview (mapas anotados), clusterProfiler::enrichKEGG.

Limitaciones / cobertura

  • Sesgo hacia rutas canónicas humanas y de organismos modelo. Cobertura desigual en metabolismo secundario.
  • Licencia restringe descargas masivas: planifica con KEGGREST y caché local.
  • Mapas curados a mano: la actualización es más lenta que MetaCyc o Reactome.

Enlaces

Relacionadas en esta página

  • MetaCyc, alternativa curada con cobertura más amplia en metabolismo secundario.
  • Recon3D y VMH, modelos ejecutables que incorporan reacciones de KEGG.
  • ChEBI, referencia química con vínculos cruzados a KEGG Compound.

MetaCyc

MetaCyc es la base de datos curada de rutas y reacciones metabólicas del SRI International (proyecto BioCyc), construida sobre revisión de literatura primaria experimentalmente verificada. Es la pieza canónica del consorcio BioCyc, que incluye además EcoCyc (E. coli K-12) y miles de PGDBs (Pathway/Genome Databases) específicas de organismo, generadas con la plataforma Pathway Tools.

Su valor diferencial frente a KEGG: cobertura mucho mayor en metabolismo secundario, vegetal y microbiano, y curación basada en evidencia experimental documentada por reacción (cada paso enlaza a citas primarias). La contrapartida es una interfaz menos amigable y una mayor curva de aprendizaje para integración programática.

Qué incluye

  • ~3.000 rutas metabólicas curadas con evidencia experimental.
  • Reacciones, compuestos, enzimas, regulación transcripcional, transportadores.
  • Cobertura especialmente fuerte en biosíntesis de metabolitos secundarios (alcaloides, terpenos, fenilpropanoides) y metabolismo microbiano.
  • Cross-refs a ChEBI, KEGG, UniProt.

Cuándo usarla

  • Estudios de metabolismo secundario (plantas, hongos, microbios).
  • Análisis donde la cobertura de KEGG es insuficiente o controvertida.
  • Reconstrucción metabólica de organismos no modelo con Pathway Tools.
  • Cuando necesitas trazabilidad de cada reacción a literatura experimental.

Cuándo NO usarla

  • Visualización rápida tipo KEGG. La estética y herramientas de visualización de KEGG (pathview) están más extendidas en biología de mamíferos.
  • FBA directo. MetaCyc es una base de reacciones, no un modelo balanceado y ejecutable. Para FBA, deriva un modelo con Pathway Tools o usa Recon3D/VMH para humano.
  • Acceso totalmente libre. Acceso académico requiere registro. La versión comercial es de pago.

Conceptos clave

  • Pathway Tools. Software propietario (gratuito para académicos) que genera PGDBs a partir de un genoma anotado. Es la vía de entrada para construir tu propia BioCyc.
  • Niveles de evidencia. Cada reacción declara código de evidencia (EV-EXP, EV-IDA, EV-COMP), explicitando si proviene de experimento, homología o predicción.
  • BioCyc API y descargas en formato SmartTables, BioPAX, SBML.
  • Solapamiento con KEGG. Muchas reacciones aparecen en ambas con identificadores distintos: el cruce no es trivial y requiere mapeo por InChIKey y EC.

Cómo se accede

Limitaciones / cobertura

  • Cobertura en humano más limitada que KEGG o Reactome.
  • Acceso académico requiere registro. Descargas masivas detrás de muro.
  • Curva de aprendizaje más alta para integración programática.

Enlaces

Relacionadas en esta página

  • KEGG, alternativa con mejor cobertura humana y visualización.
  • Recon3D, modelo humano que reutiliza reacciones de KEGG/MetaCyc.

Recon3D

Recon3D es la reconstrucción a escala genómica del metabolismo humano publicada por el grupo de Bernhard Palsson (UCSD) en 2018. Es un modelo SBML ejecutable que integra ~13.500 reacciones, ~8.400 metabolitos y ~3.300 genes, junto con información 3D de estructura proteica y mapeo a compartimentos celulares. Sucesor de Recon1 y Recon2.

A diferencia de KEGG o MetaCyc, Recon3D no es un catálogo de reacciones para consulta: es un modelo matemático ejecutable, pensado para análisis estructural de redes con FBA (Flux Balance Analysis), FVA, MOMA y otros métodos de la plataforma COBRA (cobrapy en Python, COBRA Toolbox en MATLAB).

Qué incluye

  • Red completa con estequiometría, reversibilidad y compartimentación subcelular (citosol, mitocondria, retículo, etc.).
  • Mapeo gen → proteína → reacción (GPR rules).
  • Datos 3D de estructura proteica integrados (origen del “3D” en el nombre).
  • Identificadores BiGG, ChEBI, HMDB, KEGG.

Cuándo usarla

  • Análisis FBA / FVA / robustness analysis del metabolismo humano.
  • Integración de datos ómicos (transcriptómica, proteómica) sobre la red metabólica para predecir flujos.
  • Generación de modelos tejido-específicos con métodos como GIMME, iMAT, mCADRE, FASTCORE.

Cuándo NO usarla

  • Anotación de metabolitos individuales. Usa ChEBI/HMDB.
  • Organismos no humanos. Para E. coli, levadura, etc., hay GEMs específicos (iML1515, Yeast8). Para microorganismos del intestino humano integrados con dieta, usa VMH (siguiente sección), que extiende Recon3D.
  • Pathway enrichment clásico. Recon3D es estructural. Para enrichment clásico, KEGG/Reactome.

Conceptos clave

  • SBML (Systems Biology Markup Language). Formato estándar para modelos cinéticos y de balance. Recon3D se distribuye en SBML L3 y MATLAB .mat.
  • FBA. Optimización lineal sobre la matriz estequiométrica S, con función objetivo (típicamente biomasa o ATP). Resuelve max c'v s.t. Sv = 0, lb ≤ v ≤ ub.
  • GPR rules (gene1 and gene2 or gene3): mapean expresión génica a actividad de reacción, base para integrar transcriptómica.
  • Compartimentación. Cada metabolito aparece en distintos compartimentos como entidades separadas (atp[c], atp[m]). Las reacciones de transporte conectan compartimentos.

Cómo se accede

  • Descargas: https://www.vmh.life/#downloadview (incluye Recon3D y derivados).
  • Formato: SBML, .mat, JSON.
  • Herramientas: cobrapy (Python), COBRA Toolbox (MATLAB), sybil (R, mantenimiento limitado).

Limitaciones / cobertura

  • Cobertura sesgada hacia metabolismo central y rutas bien caracterizadas. Metabolismo secundario y xenobiótico está infrarrepresentado.
  • Las predicciones FBA son cualitativas: el modelo predice flujos posibles, no necesariamente flujos reales.
  • Requiere familiaridad con COBRA y supuestos de balance estacionario.

Enlaces

Relacionadas en esta página

  • VMH, extensión que integra Recon3D con microbiota y dieta.
  • KEGG y MetaCyc, fuentes de reacciones que alimentan Recon3D.

Virtual Metabolic Human (VMH)

Virtual Metabolic Human (VMH) es la plataforma que integra Recon3D con microbiota intestinal, dieta humana y enfermedades en un único marco accesible. Mantenida por el grupo de Ines Thiele (Universidad de Galway), incluye además AGORA y AGORA2, conjuntos de cientos de modelos a escala genómica de bacterias intestinales humanas, listos para análisis comunitario.

Es la elección natural cuando el análisis cruza la frontera entre fisiología humana y metabolismo microbiano (eje intestino-hígado, metabolismo de fármacos por la microbiota, intervención dietética).

Qué incluye

  • Recon3D y derivados tejido-específicos.
  • AGORA / AGORA2: 800+ modelos GEM de bacterias intestinales humanas, parametrizados con dieta.
  • Base de datos de dietas estandarizadas (Western, Mediterranean, Vegetarian) con composición en metabolitos modelables.
  • Mapeo enfermedad ↔︎ metabolitos ↔︎ reacciones (Disease).
  • Información de fármacos y sus interacciones metabólicas.

Cuándo usarla

  • Modelos comunitarios microbiota-hospedador (Microbiome Modelling Toolbox, MICOM).
  • Diseño in silico de intervenciones dietéticas (efecto de cambiar una dieta sobre el flujo predicho).
  • Cualquier análisis donde necesites integrar Recon3D + microbioma intestinal con identificadores consistentes.

Cuándo NO usarla

  • Cuando no necesitas FBA. Si solo quieres anotar metabolitos o hacer pathway enrichment, este nivel de modelado es excesivo.
  • Microbioma no intestinal humano (suelo, marino). AGORA está sesgada al gut.
  • Modelos cinéticos. VMH integra GEMs (balance), no modelos ODE con parámetros cinéticos.

Conceptos clave

  • AGORA / AGORA2. Conjuntos de GEMs bacterianos curados y semicurados, con nomenclatura armonizada para acoplarse a Recon3D.
  • Microbiome Modelling Toolbox. Extensión del COBRA Toolbox para construir y simular comunidades.
  • Identificadores BiGG y VMH IDs. Compatibilidad entre nomenclaturas. Documentado en el portal.
  • Dietas estandarizadas. Composición predefinida en metabolitos modelables, lo que permite comparar predicciones bajo el mismo input.

Cómo se accede

  • Portal: https://www.vmh.life/
  • Descargas: modelos individuales y combinados, dietas, mapeos.
  • Herramientas: cobrapy, MICOM (Python, comunidades microbianas con FBA), Microbiome Modelling Toolbox (MATLAB).

Limitaciones / cobertura

  • AGORA2 mejora pero sigue siendo semicurada: revisar GPR rules y gap-filling antes de conclusiones fuertes.
  • El acoplamiento microbiota-hospedador en FBA requiere supuestos de comunidad que conviene declarar explícitamente.
  • Las dietas estandarizadas son una abstracción: no sustituyen datos nutricionales reales.

Enlaces

Relacionadas en esta página

  • Recon3D, modelo humano que VMH integra y extiende.
  • MetaCyc, fuente de reacciones para reconstrucciones de organismos no modelo.