Publicación de datos
| En este módulo aprenderá acerca de la publicación de datos, incentivos para publicar datos, cómo convertirse en un publicador, revisará la retroalimentación disponible para los publicadores y la información sobre artículos de datos. |
¿Qué es la publicación de datos?
| En esta sección aprenderá qué es la publicación de datos en la red GBIF. |
En términos sencillos, la publicación de datos consiste en hacer a su(s) conjunto(s) de datos de biodiversidad públicamente accesibles y plausibles de ser descubiertos en un formato estandarizado.
La mayoría de las organizaciones de la red GBIF, también conocidas como publicadores, utilizan una herramienta integrada de publicación (IPT, por sus siglas en inglés), como Integrated Publishing Toolkit, para publicar sus datos. Estos publicadores pueden optar por alojar su propia instalación de una IPT, como el Field Museum, pero generalmente prefieren encontrar un proveedor adecuado para sus actividades de publicación de datos. Esto podría ser a través de un nodo participante de GBIF ya establecido, como GBIF Francia, o a través de un grupo temático consolidado, como VertNet. Otra opción sería utilizar uno de los IPT alojados en la nube de GBIF.
| Si usted es parte de grupos como Symbiota o las comunidades de Living Atlases, ellos tienen otros medios para ayudarle a publicar sus datos en GBIF. |
Incentivos para publicar datos abiertos sobre biodiversidad
| En esta sección revisará algunos incentivos para publicar datos sobre biodiversidad. |
Una parte importante de la misión de GBIF es promover una cultura en la que las personas reconozcan los beneficios de publicar datos de biodiversidad de acceso abierto, tanto para ellas mismas como para la sociedad en general.
-
Al hacer que sus datos sean fáciles de encontrar y accesibles a través de GBIF e infraestructuras de información similares, usted contribuirá al conocimiento global sobre la biodiversidad y, por tanto, a las soluciones que promoverán su conservación y uso sostenible.
-
La publicación de datos permite la integración de conjuntos de datos en todo el mundo, revelando nuevas oportunidades de colaboración entre propietarios de datos e investigadores.
-
La publicación de datos permite que individuos e instituciones tengan el crédito adecuado por su trabajo de creación y curaduría de datos sobre biodiversidad, dando visibilidad a las instituciones publicadoras a través de una buena documentación de los metadatos. Este reconocimiento se puede desarrollar aún más si usted es autor de un artículo de datos revisado por pares, dando reconocimiento científico a la publicación de los conjuntos de datos sobre biodiversidad.
-
Los administradores de colecciones biológicas pueden rastrear el uso y las citas de los datos digitalizados y publicados desde sus instituciones que son accesibles a través de GBIF e infraestructuras similares.
-
Algunas entidades de financiación exigen ahora que los investigadores que reciben fondos públicos se aseguren de que los datos sean de acceso abierto al final de los proyectos.
Visibilidad y reconocimiento de los publicadores de datos
| En esta sección, revisará los flujos de trabajo para citar y rastrear el uso digital de datos en GBIF.org |
Dar una visibilidad y reconocimiento adecuados a los publicadores de datos es de suma importancia para GBIF. Por ello, la organización ha establecido los marcos normativos y técnicos necesarios para que citar y seguir el uso de los datos digitales sea más fácil que nunca.
Memorando de entendimiento de GBIF
GBIF es una iniciativa multilateral establecida por un acuerdo intergubernamental y basada en un "Memorando de entendimiento" (Memorandum of Understanding o MoU). El MoU es el documento oficial que los países y las organizaciones internacionales firman para unirse a GBIF.
El MoU es muy claro al afirmar que los editores de datos de GBIF deben ser reconocidos por sus contribuciones:
"4. Atribución. + GBIF trata de garantizar que se reconozca al publicador/titular de los datos y solicita que se mantenga dicha atribución en cualquier uso posterior de los mismos."
GBIF se esfuerza por hacer todos los esfuerzos posibles para que esta afirmación sea una realidad.
El acuerdo del usuario de datos GBIF
Antes de acceder a cualquier dato usando GBIF, los usuarios deben aceptar un acuerdo de usuario de datos que incluye requisitos muy específicos sobre la citación del origen de los datos a los que se accede a través de GBIF. Estos son algunos de los requisitos enumerados en el acuerdo:
"Con el fin de hacer posible la atribución del uso a los propietarios de los datos el identificador de la propiedad de los datos debe conservarse con cada registro compartido para su reutilización."
“Los usuarios deben reconocer públicamente, siguiendo la convención científica de citar las fuentes junto con el uso de los datos, a los Publicadores de Datos cuyos datos de biodiversidad han utilizado, cuando sea apropiado mediante el uso de un Identificador de Objetos Digital (DOI) que se aplique al/los conjunto(s) de dato(s) y/o a las descargas de datos.”
Del mismo modo, el acuerdo es muy específico al afirmar que deben respetarse las condiciones establecidas en las licencias seleccionadas por el publicador de los datos.
"Los usuarios deben cumplir los términos y condiciones incluidos en la licencia seleccionada por cada publicador de datos y la información de licencia incluida con cada descarga de datos. Si alguna disposición de este "acuerdo de uso" entra en conflicto con los términos y condiciones de las licencias seleccionadas por el publicador de datos, prevalecerán las licencias seleccionadas por este último."
Citación
GBIF alienta a todos los usuarios a que citen los datos obtenidos a través de la red de GBIF. Para ello, proporciona citas recomendadas en el conjunto de datos, los registros biológicos y las páginas de descarga de GBIF.org.
Esto es especialmente relevante para los conjuntos de datos publicados usando las licencias “CC-BY” y “CC-BY-NC”, que incluyen requisitos específicos para citar el origen de los datos.
Los textos de las citas y derechos se generan automáticamente para los publicadores de datos para cada conjunto de datos cuando se utiliza el IPT como mecanismo de publicación, siempre que se seleccione una de las licencias estándar.
Los publicadores de datos deben seleccionar cuidadosamente qué licencia se alinea mejor con cualquier requerimiento existente por parte de sus instituciones y con cualquier política de acceso a datos a la que puedan estar sujetos.
Página del publicador de datos
Todos los publicadores tienen su propia página en GBIF.org. Es importante que los publicadores reflexionen sobre cómo quieren aparecer en el sitio web y proporcionen información relevante sobre sus instituciones y sus equipos en el momento de registrarse. También deben esforzarse por mantener sus datos actualizados, ya que las partes interesadas utilizarán los datos de contacto de esa página para contactar al equipo responsable de la publicación de los datos.
DOI del conjuntos de datos
Cada vez que se publica una nueva versión de un conjunto de datos utilizando un IPT, se asigna un DOI (Digital Object Identifier). Como en el caso de las descargas, este identificador permite citar y rastrear fácilmente el trabajo derivado del conjunto de datos, si el usuario sigue buenas prácticas para la cita de la fuente.
Como se mencionó anteriormente, usted puede asignar un DOI mediante sitios web como doi.org/10.xxx: que siempre redireccionará a la fuente original, en este caso, la página del conjuntos de datos. También puede buscar un DOI usando una búsqueda web normal que normalmente mostrará cualquier otro recurso que cite el uso del mismo DOI como artículos o informes públicos.
Cómo convertirse en publicador de datos
| En esta sección, revisará los pasos para convertirse en un publicador de datos. |
Las organizaciones que deseen compartir datos a través de GBIF se pueden registrar aquí para solicitar aval como publicador de datos.
Se solicita a los futuros publicadores que diligencien un formulario en línea. Las respuestas proporcionadas ayudan a GBIF a dar crédito y atribución adecuados para los conjuntos de datos compartidos por el nuevo publicador.
Antes de que GBIF indexe los conjuntos de datos, la institución debe recibir apoyo como publicadora de datos de uno de los nodos participantes que coordine las actividades de los participantes nacionales y organizacionales de la red GBIF. Si el país aún no participa en GBIF, se solicita apoyo en nombre del editor desde la comunidad GBIF.
El procedimiento de aprobación tiene por objeto garantizar que:
-
Los datos publicados son relevantes para el alcance y los objetivos de GBIF
-
Los acuerdos de alojamiento de datos son estables y persistentes
-
La publicación y el uso de datos están respaldados por un fuerte compromiso nacional, regional y temático
-
Los datos son lo más abiertos posible y están disponibles para ser compartidos y reutilizados
-
Los editores de datos pueden responder a comentarios y mejorar la calidad de los datos
| Actualmente, GBIF y sus participantes sólo publican datos de organizaciones, es decir, instituciones, redes y sociedades, en lugar de individuos. Los individuos que deseen publicar datos deben trabajar a través de organizaciones afiliadas para buscar apoyo como publicador. |
Las respuestas proporcionadas también ayudarán a los usuarios a entender más sobre la procedencia de los datos compartidos a través de la red GBIF.
Asegúrese de buscar publicadores existentes antes de registrar uno nuevo para asegurarse de que el publicador no está ya registrado.
Requerimientos de calidad de datos de GBIF
| En esta sección, revisará los requisitos de calidad de los datos de GBIF. |
Los publicadores desempeñan un papel esencial no sólo en el intercambio de conjuntos de datos, sino también en la gestión de su calidad, completitud y utilidad, también, garantizan su integración y valor dentro de la base de conocimientos global de GBIF.
Para compartir datos a través de GBIF.org, los publicadores normalmente tienen que recopilar o transformar los conjuntos de datos existentes en un formato estandarizado. Este trabajo puede incluir el procesamiento adicional, la edición del contenido y el mapeo del contenido de un conjunto de datos a uno de los formatos de transferencia de datos disponibles, así como la publicación a través de una de las herramientas de publicación de datos disponibles, como la herramienta gratuita y de código abierto de GBIF Integrated Publishing Toolkit (IPT).
Una vez publicados, la infraestructura en tiempo real de GBIF "indexa" o "cosecha" nuevos conjuntos de datos, integrándolos en un sistema de acceso común en el que los usuarios pueden recuperar todos y cada uno de los datos a través de servicios comunes de búsqueda y descarga. A medida que se indexan los conjuntos de datos, GBIF.org realiza controles adicionales, rutinas de interpretaciones y de conversión para garantizar que los datos sean interoperables y cumplan las normas mínimas de formatos de datos, calidad de los mismos y aptitud para su uso. Sin embargo, muchos de los criterios de calidad y utilidad de los datos se manejan mejor y más fácilmente cuando se abordan en su fuente: el conjunto de datos individual.
Por lo tanto, los editores desempeñan un papel esencial no sólo en el intercambio de conjuntos de datos, sino también en la gestión de su calidad, integridad y utilidad, así como en la garantía de su integración y valor dentro de la base de conocimiento global de GBIF. Más información sobre requisitos de calidad de datos y recomendaciones para:
En la práctica, animamos a los responsables de publicar datos a que se familiaricen con los formatos de datos esperados y los requisitos de contenido lo antes posible en el proceso (ver también las plantillas de GBIF Excel preconfiguradas con los términos requeridos y recomendados para conjuntos de datos, listas de especies, y conjuntos de datos de eventos de muestreo, todos disponibles con datos de ejemplo). De este modo, se ahorrarán mucho esfuerzo que puede ser necesario en etapas posteriores, por ejemplo, al añadir conversiones de datos, capturar información para campos obligatorios o muy recomendados, o realizar y abordar las comprobaciones finales de calidad de los datos antes de su publicación.
| Los requisitos de calidad de los datos están plenamente documentados en la documentación técnica de GBIF. |
| Los conjuntos de datos publicados por los proyectos BID pueden tener requisitos de calidad de datos diferentes o adicionales. |
Mejorar la calidad de los datos publicados
| En esta sección, aprenderá a utilizar el validador de datos GBIF. |
El validador de datos de GBIF es un servicio que permite a cualquier persona con un conjunto de datos relevante para GBIF recibir un informe sobre la corrección sintáctica y la validez del contenido del conjunto de datos. Al enviar un conjunto de datos al validador, puede pasar por los procedimientos de validación e interpretación normalmente asociados a la publicación en GBIF y determinar rápidamente los posibles problemas en los datos, sin tener que publicarlos.
¿Cómo funciona?
Para empezar, cargue el archivo del conjunto de datos en el validador: 1) haciendo clic en SELECCIONAR ARCHIVO y seleccionándolo en su equipo local o 2) arrastrando el archivo desde una carpeta local y soltándolo en el icono SOLTAR AQUÍ. También puede introducir la URL de un archivo de conjunto de datos accesible desde Internet. Esto es especialmente útil para los conjuntos de datos más grandes. Una vez que haya pulsado el botón "Enviar", el validador comenzará a procesar su archivo de conjunto de datos y le llevará directamente a una página que muestra el estado de la validación.
Dependiendo del tamaño de su conjunto de datos, el procesamiento puede llevar un tiempo. No es necesario mantener la ventana del navegador abierta, ya que se emite un ID único de trabajo cada vez que se inicia un nuevo proceso de validación. Si su conjunto de datos está tardando demasiado en procesarse, simplemente guarde el ID (guardando la URL) y utilícelo para volver más tarde a ver el informe. Guardaremos el informe durante un mes, durante el cual podrá consultarlo cuando quiera.
¿Qué tipos de archivo son aceptados?
-
Archivos de Darwin Core comprimidos por ZIP (DwC-A) (que contienen datos del registro biológico, taxón o evento)
-
Plantillas de Excel para la Herramienta de Publicación Integrada (IPT) que contengan datos de listas de especies ("Checklist"), registros biológicos, o eventos de muestreo
-
Archivos CSV simples que contienen términos de Darwin Core en la primera fila
¿Qué información se proporciona del informe de validación?
Una vez que el procesamiento haya finalizado, podrá ver el informe de validación que contiene la siguiente información:
-
un resumen del tipo de conjunto de datos y un indicador simple de si puede ser indexado por GBIF o no
-
un resumen de los problemas encontrados durante la interpretación GBIF del conjunto de datos
-
desglose detallado de los problemas encontrados en los metadatos, el núcleo del conjunto de datos y las extensiones (si las hay), respectivamente
-
número de registros interpretados con éxito
-
frecuencia de términos usados en el conjunto de datos
También podrá ver los metadatos como una versión preliminar de la página del conjunto de datos, tal y como aparecerá cuando el conjunto de datos se publique y se registre en GBIF.
Tengo el informe de validación, ¿Ahora qué?
Si el validador encuentra que su conjunto de datos no puede ser indexado por GBIF, debería solucionar los problemas planteados por el informe de validación antes de considerar su publicación en GBIF. Por otro lado, si obtiene luz verde y su conjunto de datos es indexable por GBIF, debe revisar cuidadosamente cualquier problema que pueda ser el resultado de, por ejemplo, errores de conversión, etc. que puedan afectar a la calidad de los datos. Si encuentra y corrige cualquier error (desde un simple error tipográfico hasta grandes problemas sistemáticos) no dude en volver a enviar su conjunto de datos tantas veces como quiera.
| Problemas y banderas de calidad de datos están documentados en la documentación técnica de GBIF. |
Revisión
|
Pon a prueba tus conocimientos sobre los conceptos tratados en este módulo. Algunas preguntas pueden tener varias respuestas correctas. Puede leer más sobre las respuestas en el Apéndice de Soluciones. |