Utilización de los datos mediados por GBIF

En este módulo aprenderá cómo se utilizan los datos mediados por GBIF y cómo se accede a ellos.

Este es un repaso de la información encontrada en el curso de Introducción a GBIF, por si necesita un repaso.

¿Cómo se utilizan los datos mediados por GBIF?

El sistema de seguimiento de literatura del GBIF (https://www.gbif.org/literature-tracking^) ha identificado más de 10.000 usos (julio de 2024) de datos mediados por el GBIF, la mayoría de los cuales se encuentran en artículos revisados ​​por pares. La mayoría de estos usos se sitúan en el campo de la ecología, pero otros se relacionan con el cambio climático, la conservación, la salud humana y la agricultura. Una revisión sistemática del uso de los datos mediados por el GBIF (https://www.gbif.org/news/4tJNXqSLYd37InZxyPrU7E/data-integration-enables-global-biodiversity-synthesis) de Heberling et al. (2020)^ mostró:

  • Tanto la disponibilidad de datos como el uso de datos han aumentado con el tiempo.

  • La integración de datos facilita la investigación y el acceso mundiales.

  • Los usos de los datos mediados por GBIF traspasan los límites disciplinarios.

  • Las áreas científicas que utilizan los datos mediados por GBIF son conceptualmente diversas y cambian su prevalencia con el tiempo.

  • Los conjuntos de datos integrados a nivel mundial permiten a los investigadores hacer preguntas tanto básicas como aplicadas a escalas taxonómicas, temporales y espaciales que, de lo contrario, serían imposibles.

  • Las funciones sinérgicas de los datos de biodiversidad basados en la observación y en los especímenes ponen de manifiesto el valor y la necesidad de una mayor integración con las fuentes de datos filogenéticos, ambientales, fenotípicos, ecológicos y genéticos.

fig3
El modelo de tema estructural es el resultado de 4.035 estudios que utilizaron datos mediados por GBIF, publicados entre 2003 y 2019.

Los datos mediados por GBIF también se utilizan para supervisar el estado de la biodiversidad y el progreso hacia la consecución de los objetivos del "Convenio sobre la diversidad biológica". El aumento de la disponibilidad de los datos de ocurrencia de GBIF es uno de los indicadores para el seguimiento del progreso hacia la consecución de la meta 19 de Aichi para la Biodiversidad y GBIF es una fuente de datos clave en la creación de una serie de otros indicadores, incluyendo el Índice de información sobre el estado de las especies, el Índice de hábitat de las especies y el Índice de Hábitat de Biodiversidad.

Aunque la utilidad de los datos mediados por GBIF es evidente, la gran variedad de fuentes de datos accesibles a través de GBIF, que abarcan las colecciones de los museos, la ciencia ciudadana, la metagenómica, entre otros, significa que no todos los datos mediados por GBIF serán adecuados para todos los usos. Los componentes clave del uso de los datos mediados por GBIF son: entender cómo acceder a los datos específicos que necesita a partir de lo que está disponible en GBIF y comprender algunos de los problemas comunes de calidad de datos que afectan a los datos para facilitar su procesamiento antes del análisis.

¿Cómo se accede a los datos mediados por GBIF?

Existen dos puntos principales de acceso a los datos mediados por GBIF: GBIF.org y Servicios de interfaz de programación de aplicaciones (API). El uso del sitio web no requiere experiencia en programación y permite funciones de búsqueda, filtrado y descarga rápidas y sencillas para los datos mediados por GBIF, así como una variedad de herramientas y métricas adicionales que no están disponibles a través de los servicios API. Los servicios API permiten el acceso continuo a los datos mediados por GBIF a través de otros sistemas y pueden servir de base para el desarrollo de herramientas que permitan la consulta de los datos. Algunos ejemplos incluyen varios paquetes de R, como rgbif y CoordinateCleaner, así como herramientas más especializadas que permiten casos de uso más específicos, como GeoCat para evaluaciones de la Lista Roja.

¿Qué está disponible para mí?

A través de las funciones de búsqueda en el sitio web los usuarios pueden acceder a los datos, que pueden descargarse directamente a través de GBIF o desde las fuentes originales siguiendo los enlaces que proporciona GBIF.

Recuerde que como usuario de datos debe leer y aceptar los términos del GBIF "Acuerdo de Uso de datos" que incluyen cómo citar correctamente el uso de datos mediados por GBIF.
downloadoptions

Los datos disponibles para usted son:

  • Datos primarios de biodiversidad: datos de registros biológicos, listas de especies y eventos de muestreo que se proporcionan a los usuarios a través de uno de los 3 formatos de descarga:

    • Simple: CSV delimitado por tabulaciones. Solo contiene los datos después de la interpretación de GBIF. No incluye multimedia.

    • Archivo Darwin Core: Archivo Darwin Core (DwC-A) contiene tanto los datos originales tal como los proporcionó el publicador como la interpretación de GBIF. También, incluye enlaces (pero no archivos) a multimedia.

    • Lista de especies: CSV delimitado por tabulaciones que contiene la lista de nombres distintos incluidos en el resultado de la búsqueda y una visualización en un mapa de los datos.

  • Se ofrecen una serie de métricas para países y regiones, publicadores de datos, conjuntos de datos y búsquedas de datos que proporcionan desgloses taxonómicos, tendencias en la recopilación de datos y destacan los problemas de calidad de los datos. En el caso de los países, estas métricas también pueden descargarse en forma de informe de actividad en PDF.

  • Base de datos de publicaciones que han utilizado datos mediados por GBIF.

Se pueden realizar búsquedas en la página https://www.gbif.org/occurrence/search? species, datasets, publishers y resources, y cada función de búsqueda conlleva un conjunto de filtros que permiten una búsqueda más refinada, y en las pestañas asociadas a la búsqueda se pueden encontrar datos adicionales asociados a los datos, por ejemplo, images.