Bases de datos medioambientales y de recursos
Estadísticas agrícolas, observación de la Tierra y biodiversidad para investigación aplicada
Sobre bases de datos agrícolas y medioambientales
El ecosistema de datos públicos sobre agricultura, recursos naturales y medio ambiente se organiza en tres capas que conviene tener separadas mentalmente antes de empezar cualquier análisis:
- Estadísticas tabulares producidas por organismos oficiales (FAO, USDA, EUROSTAT, World Bank). Cobertura típicamente nacional o subnacional, frecuencia anual, formato CSV/JSON. Son el material natural para análisis macro de producción, comercio, precios y políticas.
- Observación de la Tierra (EO) procedente de constelaciones satelitales (Copernicus/Sentinel, Landsat, MODIS) y reanálisis atmosféricos (ERA5, MERRA-2). Cobertura global, raster, resolución espacial de metros a kilómetros, frecuencia diaria o subdiaria. Son la fuente para variables biofísicas: vegetación, humedad del suelo, temperatura superficial, precipitación, calidad del aire.
- Biodiversidad y ocurrencias (GBIF, OBIS, eBird). Datos puntuales georreferenciados de presencia de especies, agregados de colecciones, ciencia ciudadana y monitoreo institucional.
Tres principios prácticos que ahorran semanas de trabajo:
- Observación ≠ reanálisis ≠ simulación. Un producto MODIS de temperatura es observación directa. ERA5 es un reanálisis (modelo asimilando observaciones). Una proyección CMIP6 es simulación. Las tres se publican como rasters en cuadrícula y se mezclan con frecuencia sin distinguir su naturaleza, error caro cuando se interpretan los resultados.
- Resolución espacial y temporal mandan. Antes de descargar nada, fija el grano (10 m, 250 m, 1 km, 25 km, 0,25°) y la frecuencia (diaria, decadal, mensual). Lo que para un análisis municipal es fino, para uno parcelario es inútil, y viceversa.
- El acceso ya no es solo “descargar ficheros”. Las plataformas modernas (Google Earth Engine, AWS Open Data, Copernicus Data Space, Microsoft Planetary Computer) permiten computar sobre los datos sin moverlos. Para series temporales globales o nacionales, descargar localmente es a menudo el camino más lento.
Esta página cataloga nueve fuentes en tres bloques: primero las estadísticas tabulares (FAOSTAT, USDA NASS, EUROSTAT, World Bank Climate), luego la observación de la Tierra (Copernicus/Sentinel, NASA EarthData, MODIS, NOAA), y finalmente la capa de biodiversidad (GBIF). El orden refleja una jerarquía de uso típica en proyectos de agro-clima e investigación medioambiental: el contexto tabular fija el marco, la EO aporta el detalle biofísico, y la biodiversidad cierra el ciclo ecológico.
FAOSTAT
FAOSTAT es la base de datos estadística de la Organización de las Naciones Unidas para la Alimentación y la Agricultura (FAO). Recoge series anuales nacionales sobre producción agrícola y ganadera, comercio, uso de la tierra, insumos, precios, seguridad alimentaria, emisiones del sector agroalimentario y dieta para más de 245 países y territorios desde 1961.
Es la referencia internacional por defecto en cualquier análisis macro de sistemas alimentarios. Conviven con ella bases regionales (EUROSTAT, USDA) y nacionales más detalladas. FAOSTAT brinda la capa comparable globalmente.
Qué incluye
- Producción (cultivos y ganadería): toneladas, rendimientos, superficie cosechada.
- Comercio: matrices bilaterales de importaciones/exportaciones por producto.
- Uso de la tierra y agua: áreas agrícolas, irrigación, bosques.
- Insumos: fertilizantes, plaguicidas, maquinaria, fuerza laboral.
- Emisiones agroalimentarias: GEI desglosados por subsector (fermentación entérica, gestión de estiércol, arroz, suelos, quema).
- Seguridad alimentaria y nutrición: balances alimentarios, indicadores SDG 2.
- Precios al productor en moneda local y USD.
Cuándo usarla
- Comparaciones internacionales de producción, productividad o comercio.
- Series largas (>50 años) de variables agrarias agregadas.
- Tablas de emisiones del sistema alimentario alineadas con la metodología IPCC.
- Trabajo con balances alimentarios (FBS) para análisis de dieta y disponibilidad de calorías.
Cuándo NO usarla
- Detalle subnacional. FAOSTAT agrega a nivel de país. Para provincia, estado o municipio hay que ir al organismo nacional (USDA NASS, INE, EUROSTAT regional).
- Datos parcelarios o de finca. No es su escala.
- Variables climáticas o biofísicas (precipitación, NDVI, humedad de suelo). Para eso, EO.
- Series cuasi-tiempo real. El retraso típico es de 1 a 2 años respecto al año de referencia.
Conceptos clave
- Unidad de análisis: país-año-producto. Los códigos
Area Code,Item CodeyElement Code(M49 / FAO propios) son la clave para hacer joins limpios. - Imputación: parte de las series están imputadas o estimadas por FAO cuando el país no reporta. El campo
Flagindica el origen (oficial, estimado, calculado, imputado). Filtrarlo es buena práctica en análisis serios. - Revisiones retroactivas: FAOSTAT actualiza años pasados cuando llegan datos nuevos. Si reproduces un análisis, fija fecha de descarga o versión.
- Sistemas relacionados: FAOSTAT (estadísticas), AQUASTAT (agua), FishStat (pesca), ForestSTAT (bosques) son bases hermanas de la FAO.
Cómo se accede
- Portal web: https://www.fao.org/faostat, descarga CSV/XLSX por bulk download o quick view.
- API REST: https://fenixservices.fao.org/faostat/api/ (documentación incompleta. Reverse-engineering útil).
- R: paquete
FAOSTATen CRAN. - Python:
faostatyfaopy.
Limitaciones / cobertura
- Calidad heterogénea entre países. Las series de países con sistemas estadísticos débiles (algunas economías de África, conflicto, archipiélagos) tienen lagunas o imputaciones agresivas.
- Cambios de metodología en cobertura de emisiones (revisión 2021 introdujo el dominio
FAOSTAT GHG), comparar años antes y después requiere cuidado. - Granularidad de productos: los códigos FAO no siempre alinean con HS (comercio) o CPC. Cruzar comercio con producción exige crosswalks.
Enlaces
Relacionadas en esta página
USDA NASS, equivalente a nivel estadounidense con mayor detalle subnacional.EUROSTAT (agri), equivalente a nivel UE con detalle regional NUTS.World Bank Climate Data, contexto climático complementario.
USDA NASS
USDA NASS (National Agricultural Statistics Service) es el servicio estadístico oficial del Departamento de Agricultura de Estados Unidos. Publica censos agrícolas, encuestas trimestrales y la base Quick Stats, con series desde principios del siglo XX para cultivos, ganadería, precios, costes y prácticas agrícolas.
Es la fuente de referencia para análisis del sector agroalimentario estadounidense con detalle por estado, condado e incluso Crop Reporting District. Lo que FAOSTAT da a escala-país, NASS lo da con dos órdenes de magnitud más de resolución espacial.
Qué incluye
- Census of Agriculture (quinquenal): inventario completo de explotaciones, superficies, ganado, demografía agraria.
- Crops: producción, rendimientos, superficie sembrada/cosechada por cultivo y geografía.
- Livestock: inventarios y producción de carne, leche, huevos.
- Prices: precios al productor recibidos y pagados.
- Economics: ingresos netos, costes de producción.
- Environmental: irrigación, uso de fertilizantes y plaguicidas (CEAP, ARMS).
Cuándo usarla
- Análisis agrarios centrados en EE. UU. con detalle de condado o distrito.
- Series largas y consistentes (algunas con cobertura desde 1866).
- Cruces entre datos económicos (precios, costes) y biofísicos (rendimientos, superficies).
- Validación o calibración de productos EO en territorio estadounidense (es uno de los ground truths más completos del mundo).
Cuándo NO usarla
- Fuera de EE. UU.: NASS solo cubre territorio estadounidense.
- Datos parcelarios individuales. Hay confidencialidad estricta, los datos por condado se suprimen (
(D)) cuando hay menos de 3 operaciones para evitar identificación. - Frecuencia subanual de algunos cultivos: muchas series son anuales. Crop Progress sí es semanal pero solo durante campaña.
Conceptos clave
- Geografía jerárquica: nacional → estado → distrito (
Ag District) → condado. Hay supresión estadística ((D)) en los niveles inferiores cuando el conteo no permite anonimato. - Quick Stats: la base unificada que sustituyó al sistema anterior. Consultable vía web o API.
- Census vs Surveys: el censo (quinquenal) es exhaustivo. Las Surveys son muestrales y se publican entre censos.
- ARMS (Agricultural Resource Management Survey) es la encuesta económica y ambiental detallada, con microdatos restringidos.
Cómo se accede
- Portal Quick Stats: https://quickstats.nass.usda.gov/
- API REST: https://quickstats.nass.usda.gov/api (requiere registro gratuito y clave).
- R: paquete
tidyUSDAyrnassqs. - Python: cliente directo HTTP (no hay paquete oficial maduro. Varios wrappers comunitarios).
- Cropland Data Layer (CDL): raster anual de uso del suelo en EE. UU. a 30 m, distribuido por separado (https://nassgeodata.gmu.edu/CropScape/).
Limitaciones / cobertura
- Supresión por confidencialidad en granularidad alta, puede frustrar análisis de cultivos minoritarios o condados poco poblados.
- Cambios de definición entre censos (qué cuenta como “granja”, ajustes de cobertura) que rompen series largas si no se documentan.
- Datos económicos dependen del marco ARMS, no siempre comparables con sistemas contables europeos (FADN).
Enlaces
Relacionadas en esta página
FAOSTAT, contexto internacional comparable.EUROSTAT (agri), equivalente europeo con regionalización NUTS.NASA EarthDatayMODIS, EO complementaria para validación cruzada con CDL.
EUROSTAT (agri)
EUROSTAT es la oficina estadística de la Unión Europea. Sus dominios agrícolas y medioambientales cubren producción, ganadería, comercio agroalimentario, contabilidad económica de la agricultura (EAA), uso del suelo (LUCAS), agua, residuos, energía y emisiones para los Estados miembros, candidatos y EFTA.
El valor diferencial frente a FAOSTAT es la regionalización NUTS (Nomenclature of Territorial Units for Statistics): muchas series están disponibles a NUTS 2 (regiones europeas, ~300 unidades) y algunas a NUTS 3 (~1.300 unidades), con definiciones armonizadas entre países.
Qué incluye
- Agricultura: encuesta de estructura agraria (FSS), uso del suelo (LUCAS), rendimientos, producción animal, precios.
- EAA (Economic Accounts for Agriculture): output, costes, valor añadido, subvenciones.
- Comercio agroalimentario vía Comext (a partir del HS-8).
- Medio ambiente: cuentas físicas de flujos de materiales (EW-MFA), emisiones por sector (AEA), cuentas de agua.
- Tierras y bosques: LUCAS (encuesta de campo armonizada), CORINE Land Cover.
Cuándo usarla
- Análisis comparativos entre Estados miembros UE con metodología homogénea.
- Cualquier estudio que necesite detalle regional NUTS (políticas PAC, desarrollo rural, brecha urbano-rural).
- Cruce con datos económicos del sector vía EAA.
- Series de uso del suelo armonizadas para Europa (LUCAS, CORINE).
Cuándo NO usarla
- Fuera de UE/EFTA/candidatos. Para datos comparables globales, FAOSTAT.
- Subdivisión NUTS 3 universal: no todas las variables están disponibles a NUTS 3, verifica antes.
- Datos parcelarios: LUCAS llega a punto de muestreo pero no a parcela.
Conceptos clave
- Códigos NUTS: jerarquía NUTS 0 (país) → NUTS 1 → NUTS 2 → NUTS 3. Cambian con revisiones (NUTS 2013, 2016, 2021). Los crosswalks oficiales son imprescindibles para series largas.
- LUCAS: encuesta de campo trianual, ~340.000 puntos de muestreo en Europa, con observación directa de uso/cobertura del suelo, fotos y desde 2018 muestras de suelo.
- Comext: base de comercio detallado (HS-8) con flujos intra-UE y extra-UE.
- EAA: contabilidad sectorial bajo SEC 2010, comparable con cuentas nacionales.
Cómo se accede
- Portal web: https://ec.europa.eu/eurostat/data/database
- API REST (JSON-stat): https://ec.europa.eu/eurostat/web/main/help/data-services-api
- R: paquetes
eurostat(CRAN) yrestatapi. - Python:
eurostatypandasdmx. - SDMX: protocolo estándar de intercambio estadístico soportado por la API.
Limitaciones / cobertura
- Latencia variable entre dominios, algunas series mensuales se publican con 2-3 meses de retraso. Otras anuales con 1-2 años.
- Revisiones NUTS rompen comparabilidad histórica si no se gestionan con los crosswalks oficiales.
- LUCAS y CORINE conviven pero no son intercambiables: LUCAS es encuesta puntual con datos de suelo. CORINE es cartografía raster derivada de imagen satélite (100 m, 6 años).
Enlaces
Relacionadas en esta página
FAOSTAT, contexto global.USDA NASS, equivalente estadounidense.Copernicus / Sentinel, fuente de CORINE y de productos derivados a escala europea.
World Bank Climate Data
El Climate Change Knowledge Portal (CCKP) del Banco Mundial consolida indicadores climáticos históricos y proyecciones a nivel país y cuenca, derivados de productos científicos (CRU, ERA5, CMIP6) y armonizados para usuarios no especializados. Forma parte de la familia más amplia de datos abiertos del Banco Mundial (World Development Indicators, Climate Watch, etc.).
No es una fuente primaria de datos climáticos, es una capa de acceso amigable sobre productos existentes, con énfasis en indicadores listos para usar en informes y análisis macro.
Qué incluye
- Histórico observacional: temperatura, precipitación, índices de extremos (CRU TS, ERA5).
- Proyecciones CMIP6: temperatura, precipitación, anomalías por SSP (SSP1-2.6, SSP2-4.5, SSP3-7.0, SSP5-8.5) y por horizonte (2020-2039, 2040-2059, etc.).
- Indicadores de impacto: días cálidos, frecuencia de sequía, índices SPI/SPEI.
- World Development Indicators (vía portal hermano): contexto socioeconómico (emisiones por país, intensidad energética, acceso a agua).
Cuándo usarla
- Informes país-clima a nivel macro (perfiles climáticos nacionales).
- Cuando necesitas proyecciones CMIP6 ya agregadas a país y armonizadas, sin manejar NetCDF directamente.
- Análisis de exposición climática para sectores económicos en contextos de desarrollo.
- Como contexto en estudios donde el clima no es el foco principal pero hay que situarlo.
Cuándo NO usarla
- Análisis científico o regional fino. Para eso, ve a la fuente primaria: ERA5 (Copernicus CDS), CRU TS, CHIRPS, CMIP6 (ESGF).
- Resolución espacial intra-país: los agregados son nacionales o de cuenca, no en cuadrícula.
- Series cuasi-tiempo real: no es su nicho.
Conceptos clave
- CMIP6 vs CMIP5: las proyecciones del CCKP usan CMIP6 (la más reciente, base de IPCC AR6). Proyectos antiguos pueden referenciar CMIP5.
- SSPs (Shared Socioeconomic Pathways): escenarios socioeconómicos que reemplazan los antiguos RCPs como base de las proyecciones CMIP6.
- Bias-correction: los datos del portal aplican corrección de sesgo respecto a observaciones, necesario para que las proyecciones sean comparables con histórico.
Cómo se accede
- Portal web: https://climateknowledgeportal.worldbank.org/
- Descarga directa: CSV por país desde el portal.
- API REST World Bank (datos generales WDI): https://datahelpdesk.worldbank.org/knowledgebase/articles/889392
- R: paquete
wbstatspara WDI. CCKP no tiene cliente R oficial. - Python:
wbgapi.
Limitaciones / cobertura
- Agregación nacional pierde mucha información. Países grandes y heterogéneos (Brasil, India, EE. UU., China) quedan mal representados por un único valor país.
- No es la fuente científica de referencia: para publicaciones, cita los productos primarios subyacentes, no el portal.
- Actualización periódica pero discreta: el portal se renueva en releases mayores. Revisa fecha del corte.
Enlaces
Relacionadas en esta página
FAOSTAT, contexto socioeconómico agrario complementario.Copernicus / Sentinel, ERA5 y reanálisis (fuente primaria de muchos indicadores CCKP).NASA EarthData, observaciones climáticas independientes para validación.
Copernicus / Sentinel (ESA)
Copernicus es el programa europeo de observación de la Tierra operado conjuntamente por la Comisión Europea y la Agencia Espacial Europea (ESA). Sus satélites Sentinel (Sentinel-1 SAR, Sentinel-2 óptico multiespectral, Sentinel-3 ocean/land, Sentinel-5P atmósfera, Sentinel-6 altimetría) producen datos abiertos y gratuitos con cobertura global, frecuencia de pocos días y resolución de 10 a 300 metros.
Además de los satélites, Copernicus opera seis servicios temáticos: atmósfera (CAMS), cambio climático (C3S, que distribuye ERA5), tierra (CLMS, donde vive CORINE Land Cover), marino (CMEMS), emergencias (EMS) y seguridad. La envergadura del programa lo convierte en la columna vertebral de la EO civil europea, equivalente y complementario a NASA EarthData.
Qué incluye
- Sentinel-1: SAR banda C, 5×20 m, día/noche, todo tiempo. Humedad de suelo, monitoreo de cultivos, subsidencia, hielo marino.
- Sentinel-2: 13 bandas ópticas, 10/20/60 m, revisita 5 días con la constelación. Vegetación (NDVI, NDWI, LAI), uso del suelo, agricultura de precisión.
- Sentinel-3: OLCI (océano/tierra, 300 m), SLSTR (temperatura superficial), altímetro. Calidad de agua, SST, productividad primaria.
- Sentinel-5P: TROPOMI, calidad del aire (NO₂, SO₂, CH₄, CO, O₃, aerosoles) a 5,5×3,5 km diario.
- ERA5 (vía CDS): reanálisis atmosférico global, 0,25°, horario, desde 1940.
- CORINE Land Cover y productos High Resolution Layers (vía CLMS).
Cuándo usarla
- Cualquier análisis biofísico que necesite EO óptica o radar a 10-20 m con cobertura global recurrente.
- Series temporales de vegetación (NDVI Sentinel-2), humedad de suelo (Sentinel-1) o uso del suelo (CORINE + S2).
- Variables atmosféricas y climáticas con reanálisis (ERA5) o calidad del aire (S5P).
- Productos derivados europeos armonizados (CLMS HR Layers, CORINE).
Cuándo NO usarla
- Resoluciones submétricas: para 0,5-1 m hay que ir a comerciales (Planet, Maxar) o aérea.
- Series históricas pre-2014/2015: Sentinel-2A se lanzó en 2015. Para retrocesos largos, MODIS (2000-) o Landsat (1972-).
- Análisis sin capacidad de procesar raster a escala: descargar terabytes requiere arquitectura. Considera GEE o procesamiento cloud-native.
Conceptos clave
- Niveles de procesamiento: L1C (TOA reflectancia, ortorrectificada), L2A (BOA, corregida atmosféricamente). Para análisis temporal usa siempre L2A.
- Tiles MGRS en Sentinel-2 (100×100 km en UTM). Las series se construyen sobre el mismo tile a lo largo del tiempo.
- STAC (SpatioTemporal Asset Catalog): estándar emergente para catalogar imágenes EO. Copernicus Data Space ofrece endpoint STAC.
- Reanálisis ≠ observación: ERA5 es un modelo asimilando observaciones. No confundirlo con un sensor directo.
Cómo se accede
- Copernicus Data Space Ecosystem: https://dataspace.copernicus.eu/ (sustituye al antiguo SciHub desde 2023). Portal web, API OData/STAC, JupyterHub.
- Climate Data Store (CDS) para ERA5: https://cds.climate.copernicus.eu/ + API
cdsapi. - Atmosphere Data Store (ADS) para CAMS: https://ads.atmosphere.copernicus.eu/.
- AWS Open Data: Sentinel-1/-2 hospedados en S3 (
s3://sentinel-s2-l2a/). - Google Earth Engine: catálogo completo de Sentinel + ERA5.
- Microsoft Planetary Computer: catálogo STAC con acceso cloud-native.
- R/Python:
sen2r,sentinelsat,cdsapi,eodag,pystac-client,stackstac.
Limitaciones / cobertura
- Cobertura de nubes en S2 obliga a gapfilling o composición temporal para series limpias.
- ERA5 a 0,25° (~27 km en ecuador), útil para clima, insuficiente para microescala.
- Latencia: imágenes Sentinel-2 disponibles ~2-3 horas tras adquisición (NRT) o ~día siguiente (estándar). Reanálisis ERA5 con ~5 días de retraso. ERA5T para preliminar.
- Volumen: la descarga directa para análisis nacionales o continentales no escala, el patrón moderno es computar en GEE / Planetary Computer / Copernicus Data Space.
Enlaces
Relacionadas en esta página
NASA EarthData, programa equivalente del lado estadounidense.MODIS, opción de menor resolución pero serie histórica más larga.World Bank Climate Data, agregaciones país de ERA5.
NASA EarthData
NASA EarthData es el portal unificado de acceso a los archivos de observación de la Tierra de la NASA. Engloba ~10 PB de productos distribuidos por los DAACs (Distributed Active Archive Centers) especializados por temática: PO.DAAC (océanos), GES DISC (atmósfera), LP DAAC (procesos terrestres, donde vive MODIS), NSIDC (criosfera), ORNL DAAC (biogeoquímica), entre otros.
Cubre desde misiones históricas (Landsat conjunta con USGS, MODIS, Aqua, Terra) hasta operativas actuales (SMAP, GPM, ICESat-2, SWOT, ECOSTRESS) y futuras (PACE, NISAR). Es la contrapartida estadounidense de Copernicus, con un catálogo más amplio en variables atmosféricas, criosféricas y oceánicas.
Qué incluye
- Atmósfera: MERRA-2 (reanálisis), GPM IMERG (precipitación), AIRS, MLS, OMI/OMPS (ozono y trazas).
- Tierra: MODIS (L1B-L4), VIIRS, Landsat, SRTM, ASTER, ECOSTRESS (estrés hídrico), GEDI (LiDAR forestal), SMAP (humedad de suelo).
- Criosfera: ICESat-2, IceSat, AMSR-E/2, productos NSIDC.
- Océano: SST MUR, MODIS-Aqua clorofila, altimetría Jason/SWOT.
- Biogeoquímica: flujos de carbono, biomasa forestal, fenología.
Cuándo usarla
- Cualquier variable biofísica global con respaldo de misión NASA.
- Series largas (MODIS desde 2000, Landsat conjunta desde 1972).
- Productos específicos sin equivalente en Copernicus (GPM IMERG para precipitación global, SMAP para humedad de suelo, ECOSTRESS, GEDI para biomasa).
- Reanálisis MERRA-2 como alternativa o complemento a ERA5.
Cuándo NO usarla
- Cuando Copernicus cubre la necesidad mejor. Para Sentinel-2 (10 m óptico europeo/global), Copernicus es la fuente. NASA EarthData no aloja Sentinel.
- Análisis sin capacidad cloud-native: muchos productos llegan en HDF5/NetCDF voluminosos. El ecosistema moderno es STAC + Zarr.
Conceptos clave
- Earthdata Login: cuenta única que da acceso a todos los DAACs (registro gratuito).
- DAAC: cada centro especializa por temática y distribuye sus productos con APIs propias además del portal común.
- CMR (Common Metadata Repository): catálogo unificado consultable vía API.
- NetCDF / HDF5: formato dominante. Para procesamiento moderno, las versiones Zarr en cloud son preferibles.
- Niveles de procesamiento: L0 (raw) → L1 (calibrado) → L2 (geofísico) → L3 (gridded) → L4 (modelado). En análisis aplicado se trabaja típicamente con L2/L3/L4.
Cómo se accede
- Portal Earthdata Search: https://search.earthdata.nasa.gov/
- API CMR: https://cmr.earthdata.nasa.gov/search/
- AppEEARS: https://appeears.earthdatacloud.nasa.gov/, extracción puntual/área pequeña sin descargar el raster completo (especialmente útil para MODIS, VIIRS, ECOSTRESS).
- AWS Open Data: muchos productos hospedados en S3 (
s3://nasa-*). - GHRC, NSIDC, GES DISC, LP DAAC: portales especializados por DAAC.
- Google Earth Engine: gran parte de productos NASA disponibles en el catálogo GEE.
- Python:
earthaccess(oficial NASA),harmony-py. - R:
MODIStsp,MODISTools,terra+ descarga directa.
Limitaciones / cobertura
- Fragmentación entre DAACs: APIs y convenciones de naming varían. CMR ayuda pero no elimina la fricción.
- Cambios de generación: por ejemplo, MODIS Collection 6 vs 6.1, usar siempre la última collection disponible.
- Sunset de misiones: Terra y Aqua (MODIS) están al final de su vida útil. VIIRS sobre Suomi-NPP y NOAA-20 es el reemplazo operativo. Para series largas hay que armonizar.
Enlaces
Relacionadas en esta página
Copernicus / Sentinel, contrapartida europea, complementaria.MODIS, el producto NASA más usado en aplicaciones agroambientales. Ficha aparte.NOAA, fuente paralela para variables meteorológicas y climáticas operativas.
MODIS
MODIS (Moderate Resolution Imaging Spectroradiometer) es el sensor a bordo de los satélites Terra (2000) y Aqua (2002) de la NASA. Aunque al final de su vida útil, Terra y Aqua están en órbita degradada, sigue siendo una de las fuentes de datos de observación de la Tierra más utilizadas por la longitud de su serie (>25 años continuos) y la riqueza de productos derivados.
Su sucesor operativo es VIIRS (Suomi-NPP, NOAA-20, NOAA-21). Mantiene continuidad con MODIS pero las series no son trivialmente comparables.
Qué incluye
Productos organizados por código (MOD* = Terra, MYD* = Aqua, MCD* = combinado):
- Reflectancia y superficie: MOD09 (reflectancia), MOD11 (LST, temperatura superficial), MOD43 (albedo).
- Vegetación: MOD13 (NDVI/EVI a 250 m, 16 días), MOD15 (LAI/FPAR), MOD17 (productividad primaria).
- Cobertura del suelo: MCD12 (clasificación anual IGBP, UMD, etc. a 500 m).
- Fenología: MCD12Q2 (fenología vegetal).
- Fuegos: MOD14 (anomalías térmicas), MCD64 (área quemada).
- Nieve/hielo: MOD10.
- Atmósfera: aerosoles, vapor de agua, nubes (MOD04, MOD05, MOD06).
Cuándo usarla
- Series temporales largas (>20 años) de vegetación, temperatura superficial o cobertura.
- Análisis a escala regional/continental donde 250-500 m basta.
- Frecuencia diaria (revisita 1-2 días), útil cuando la cobertura de nubes obliga a compositar.
- Estudios fenológicos donde la serie histórica es indispensable.
Cuándo NO usarla
- Resolución parcelaria o detalle <250 m: Sentinel-2 (10 m) o Landsat (30 m) son mejores.
- Análisis post-2025 con expectativa de continuidad: Terra/Aqua están en EOL. Pivota a VIIRS.
- Áreas pequeñas y heterogéneas donde 250 m mezcla cubiertas.
Conceptos clave
- Sinusoidal tiles (
h*v*): MODIS particiona el globo en mosaicos sinusoidales de ~10×10°. Para extraer una zona, identifica primero los tiles que la cubren. - Collection: la versión del procesamiento (actualmente Collection 6.1). Mezclar collections en una serie temporal es un error frecuente.
- Quality Assurance (QA) bits: cada píxel viene con bits de calidad codificados, imprescindible filtrar por QA antes de cualquier estadístico.
- Compositing: muchos productos son composiciones de 8 o 16 días (MOD09A1, MOD13Q1) que ya integran la decisión de qué píxeles diarios usar.
Cómo se accede
- LP DAAC (Land Processes DAAC): https://lpdaac.usgs.gov/
- NASA Earthdata Search y AppEEARS, AppEEARS es especialmente cómodo para extracciones puntuales sin descargar tiles enteros.
- Google Earth Engine: catálogo completo MODIS, ideal para análisis temporales globales.
- AWS Open Data: parte de MODIS hospedada en S3.
- R:
MODIStsp,MODISTools. - Python:
pymodis,earthaccess.
Limitaciones / cobertura
- Resolución 250-1000 m según producto, no apto para escala fina.
- Misión en EOL: Terra (lanzada 1999) y Aqua (2002) están más allá de su vida útil nominal. Planifica migración a VIIRS para análisis nuevos con horizonte >5 años.
- Calibración entre Terra y Aqua: hay diferencias pequeñas, productos
MCD*ya las gestionan.
Enlaces
Relacionadas en esta página
NASA EarthData, portal madre que distribuye MODIS y su sucesor VIIRS.Copernicus / Sentinel, mayor resolución espacial pero serie más corta.
NOAA
NOAA (National Oceanic and Atmospheric Administration) opera la red de satélites meteorológicos geoestacionarios (GOES-R) y polares (JPSS / NOAA-20, NOAA-21) de Estados Unidos, además de la red de estaciones meteorológicas y oceanográficas nacionales y los grandes bancos de datos climáticos del National Centers for Environmental Information (NCEI).
Es la referencia operativa para meteorología, clima histórico y estado del océano en Norteamérica, con productos globales relevantes para todo el mundo (datos de tormentas, ENSO, reanálisis NCEP/NCAR, datos paleoclimáticos).
Qué incluye
- Climate Data Online (CDO): estaciones meteorológicas históricas (GHCN-Daily, GHCN-Monthly, ISD).
- GOES-R: imágenes geoestacionarias del hemisferio occidental cada 10-15 minutos (ABI), detección de rayos (GLM).
- JPSS / VIIRS: continuador de MODIS para órbita polar.
- Reanálisis NCEP/NCAR, CFSR: alternativas a ERA5/MERRA-2 con respaldo NOAA.
- NCEI: paleoclima, ENSO, hurricanes (HURDAT2), tsunami, mareas.
- Climate.gov, Drought Monitor (USDM): portales aplicados.
- Sea Surface Temperature: OISST, Coral Reef Watch.
Cuándo usarla
- Estaciones meteorológicas globales históricas (GHCN-Daily es la base de muchos análisis climáticos).
- Monitoreo meteorológico en tiempo casi real para Norteamérica (GOES-R).
- ENSO, índices climáticos teleconectivos (NAO, PDO, MJO).
- SST operativa (OISST), referencia para análisis de anomalías oceánicas.
- Datos paleoclimáticos (anillos de árboles, núcleos de hielo, sedimentos).
Cuándo NO usarla
- Mejor cobertura europea u observación a 10 m: Copernicus es preferible.
- Reanálisis “default” en literatura actual: ERA5 (Copernicus) es hoy más citado que NCEP/NCAR.
- API unificada y moderna: NOAA está fragmentada entre NCEI, CO-OPS, NWS, NDBC, cada uno con su API y formato, fricción mayor que Copernicus o NASA EarthData.
Conceptos clave
- GHCN-Daily: ~115.000 estaciones a nivel global con datos diarios de TMAX, TMIN, PRCP, SNOW. Base de referencia para series instrumentales largas.
- ISD (Integrated Surface Database): datos subdiarios de superficie, ~14.000 estaciones operativas.
- HURDAT2: archivo histórico de huracanes del Atlántico y Pacífico oriental.
- NCEI consolidó NCDC, NODC y NGDC en 2015, referencias antiguas a esos centros apuntan ahora a NCEI.
Cómo se accede
- Portal CDO: https://www.ncdc.noaa.gov/cdo-web/
- API NCEI: https://www.ncei.noaa.gov/access/services/data/v1
- CO-OPS (mareas, vientos): https://api.tidesandcurrents.noaa.gov/
- NWS API (pronóstico): https://api.weather.gov/
- AWS Open Data: GOES-R, NEXRAD, GFS hospedados en S3 (
s3://noaa-goes16/,s3://noaa-nexrad-level2/). - R:
rnoaa(archivado en CRAN. Activo en GitHub),riempara ISD. - Python:
noaa-sdk,metpy, descarga directa.
Limitaciones / cobertura
- Fragmentación de APIs y portales: cada subagencia opera el suyo.
- GHCN-Daily depende de aportes nacionales: España aporta solo un subconjunto de AEMET. Para series largas españolas, ir a fuentes nacionales (AEMET OpenData).
- Cambios de instrumento en estaciones históricas exigen homogeneización para análisis de tendencias serias.
Enlaces
Relacionadas en esta página
NASA EarthData, colabora con NOAA en VIIRS y muchos productos atmosféricos.Copernicus / Sentinel, alternativa europea para reanálisis (ERA5) y atmósfera (CAMS, S5P).
GBIF
GBIF (Global Biodiversity Information Facility) es la infraestructura internacional de datos de biodiversidad. Agrega ocurrencias de especies, registros georreferenciados que documentan dónde y cuándo se observó o colectó cada taxón, procedentes de museos de historia natural, herbarios, agencias de monitoreo, proyectos de investigación y plataformas de ciencia ciudadana (iNaturalist, eBird vía EOD, etc.).
Es la base mundial de referencia para macroecología, biogeografía, modelos de nicho ecológico (SDM), conservación y trabajo aplicado en biodiversidad. Más de 2.500 millones de registros de ocurrencia a fecha actual.
Qué incluye
- Ocurrencias (
Occurrence): registros puntuales con coordenadas, fecha, taxón identificado, fuente y metadatos. - Datasets: cada conjunto agregado a GBIF está descrito como dataset con su DOI propio y su licencia.
- Backbone Taxonomy: árbol taxonómico de referencia (NUB) que GBIF usa para conciliar nombres entre instituciones.
- Checklists: listas de especies por región/temática.
- Sampling-event datasets: muestreos estructurados con esfuerzo conocido (no solo presencia).
Cuándo usarla
- Modelos de distribución de especies (SDM, MaxEnt, etc.).
- Estudios macroecológicos y de biogeografía.
- Análisis de cambios de distribución bajo cambio climático.
- Conservación: priorización espacial, identificación de hotspots.
- Validación de registros de especies invasoras o de interés agronómico.
Cuándo NO usarla
- Abundancia con esfuerzo de muestreo: la mayoría de los registros GBIF son presencia (no abundancia ni esfuerzo). Para estudios cuantitativos serios, filtra a sampling-event datasets y trabaja con los conjuntos que aportan esfuerzo.
- Inferencia sin curación: GBIF agrega datos heterogéneos. La curación (identificación correcta, coordenadas válidas, sesgo de muestreo) es responsabilidad del usuario. Herramientas como
CoordinateCleanerson prácticamente obligatorias. - Datos sensibles (especies amenazadas con coordenadas oscurecidas): GBIF aplica generalization a algunos taxones. Verifica antes de inferir distribución fina.
Conceptos clave
- Darwin Core (DwC): estándar de metadatos para registros de biodiversidad. GBIF expone los datos con campos DwC (
scientificName,decimalLatitude,decimalLongitude,eventDate, etc.). - gbifID: identificador único por registro. Imprescindible para citar y rastrear.
- DOI por descarga: cada descarga genera un DOI persistente que cita los datasets contribuyentes. Citar el DOI, no el portal, es buena práctica académica.
- Issue flags: GBIF marca registros con problemas comunes (coordenadas en centroide de país, fecha imposible, taxonomía dudosa). Filtrar
hasGeospatialIssue = falsey revisar flags es paso obligatorio. - Sesgo de muestreo: la cobertura espacial es muy heterogénea, Europa y Norteamérica densas, regiones tropicales y polares dispersas. Cualquier inferencia de abundancia o ausencia ignorando esto es inválida.
Cómo se accede
- Portal web: https://www.gbif.org/
- API REST: https://www.gbif.org/developer/summary (búsqueda + descarga + ocurrencias).
- R:
rgbif(rOpenSci), el cliente más usado. - Python:
pygbif. - Descarga asíncrona: descargas grandes (>100K registros) se solicitan por API y se reciben por email con DOI asignado.
- Datos asociados: secuencias en ENA/NCBI, imágenes, audios.
Limitaciones / cobertura
- Calidad heterogénea. Necesita limpieza activa: validación de coordenadas, taxonomía, fechas.
- Sesgo de cobertura espacial y temporal: el muestreo está concentrado en regiones con redes científicas activas y en ciertas estaciones del año.
- Cobertura taxonómica desigual: aves e insectos sobre-representados frente a hongos, microorganismos, microfauna del suelo.
- Licencias mixtas: la mayoría es CC0/CC-BY pero hay datasets restringidos. Verifica antes de uso comercial.
Enlaces
Relacionadas en esta página
Copernicus / SentinelyNASA EarthData, variables ambientales (clima, vegetación, suelo) como predictores en modelos de distribución sobre ocurrencias GBIF.World Bank Climate Data, contexto climático complementario para análisis de respuesta de la biodiversidad al cambio climático.