Caso de uso I: especímenes de herbario
|
Familiarícese con el escenario del caso de uso. |
Escenario
Un proyecto de movilización de datos en un herbario regional
Esta narrativa fue desarrollada como base para ejercicios prácticos en el curso de movilización de datos de biodiversidad y el concepto y contenido del ejercicio fue desarrollado por Alberto González-Talaván, Néstor Beltrán, Nicolas Noé, Sharon Grant. Los datos provienen de un conjunto de datos real, pero se han modificado para los fines de estos ejercicios. Es un escenario ficticio y solo tiene fines educativos.
Descripción
La Universidad de White Plains es una institución de educación terciaria reconocida en Guatemala y una referencia nacional para la investigación de la biodiversidad. El Departamento de Biología Vegetal mantiene un herbario de tamaño mediano que contiene aproximadamente 80,000 especímenes recolectados en y alrededor de la región local y que data de mediados del siglo XX hasta el presente. La colección incluye especímenes importantes, incluidos tipos y endémicos.
Actualmente, el cuidado de la colección está a cargo del profesor de Sistemática Vegetal, quien realiza tareas curatoriales así como su labor habitual de investigación y docencia. El Administrador Departamental es responsable de las tareas administrativas diarias del herbario, como la compra de insumos, incluidos papel y etiquetas. El personal docente y los estudiantes que colaboran dentro del departamento ocasionalmente trabajan y actualizan las identificaciones de los especímenes, y hay dos botánicos jubilados que regularmente se ofrecen como voluntarios en la colección, ayudando al profesor a preparar los préstamos.
La Universidad ya tiene una búsqueda en línea para las colecciones de su biblioteca que es mantenida por el equipo web central de la Universidad en servidores alojados externamente. Actualmente, no están disponibles especímenes de historia natural a través de esta plataforma.
El Jefe del Departamento de Biología Vegetal ha obtenido recientemente una subvención de por años de 50.000 USD para generar imágenes y publicar la información de las colecciones botánicas en línea. El equipo quiere aprovechar esta oportunidad para establecer un protocolo de digitalización y publicación permanente que le dará mayor visibilidad al herbario y seguirá atrayendo financiación.
Recopilación de datos
El herbario comprende aproximadamente 80.000 especímenes colectados entre 1960 y 2015 concentrados principalmente en una zona de alta biodiversidad: el Parque Nacional Short Mountain. La colección sigue creciendo como resultado de intercambios, donaciones y varios proyectos de investigación activos. Para cada espécimen, se documenta información sobre el colector, la hora, la fecha, la ubicación y la taxonomía. Hasta ahora no se han llevado a cabo medidas de control de calidad sobre los datos y no se ha realizado una toma de imágenes sistemática de los especímenes.
Ejercicios
Descargue el archivo exercise sheet (MS Word 345 KB).
Ejercicio 1
Captura de datos
Imagine que usted es la persona encargada de transcribir los datos encontrados en los ejemplares del herbario.
-
Descarga UC-HS-1-base-material.zip. (34,4 MB). Hay 10 imágenes. Dos imágenes por espécimen, para un total de cinco especímenes. Las hojas del herbario están en español (es posible que recibas los datos por diversos medios y en otros idiomas), pero deberías poder reconocer la información en los campos de las etiquetas. Recuerda usar ambas imágenes por registro para recopilar la información.
-
Descargue la plantilla de hoja de cálculo: UC-HS-1-occurrence-template.xlsx (57,3 KB) para transcribir la información que se encuentra en cada una de las imágenes de los cinco especímenes.
-
Use la hoja de ejercicios para proporcionar sus respuestas y envíe la hoja de cálculo.
Ejercicio 2
Gestión de datos
Su institución forma parte de la Asociación Global de Poales (GPA). Esta asociación ha obtenido financiación para publicar una flora actualizada de este grupo y ha solicitado la participación de su herbario, aportando cualquier registro de alta calidad que posea sobre este orden de plantas. Dado que el orden está bien representado en su colección, usted considera que podría contribuir sustancialmente a este proyecto.
-
Descargar UC-HS-2-data-cleaning.csv. (213 KB)
-
Evalúe el conjunto de datos e identifique qué tipos de errores están presentes.
-
Identifique posibles formas de corregir esos problemas y realice las correcciones para la mayor cantidad de errores que pueda.
-
Use la hoja de ejercicios para proporcionar sus respuestas y envíe la hoja de cálculo.
Ejercicio 3
Publicación de datos
Después de limpiar los datos del conjunto de datos de Poales, el equipo considera que publicar los datos en línea a través de la red GBIF podría ser una buena manera de hacer visible este esfuerzo. Se le ha solicitado que lidere ese trabajo de publicación, basándose en el conjunto de datos.
-
Descargar UC-HS-3-poales-publishing.csv. (233,5 KB)
-
Utilice la instalación IPT previamente proporcionada para publicar el conjunto de datos dado.
-
Utilice la hoja de ejercicios para proporcionar sus respuestas y el enlace al conjunto de datos publicado.