Use Case - Lepidoptera sightings
|
Familiarisez-vous avec le scénario du cas d’utilisation. |
Scénario
Échantillonnage de Lepidoptera à travers différents pays
Ce scénario a été élaboré comme base pour les exercices pratiques du cours de mobilisation des données de biodiversité. Le concept et le contenu de l’exercice ont été développés par Alberto González-Talaván, sur la base des travaux antérieurs d’Alberto González-Talaván, Danny Vélez, Larissa Smirnova, Laura Russell, Mélianie Raymond et Nicolas Noé. Il s’agit d’un scénario fictif qui n’est destiné qu’à des fins pédagogiques.
Description
L’International Butterfly Amateur Network (IBAN) fournit un cadre pour les groupes d’observation amateurs nationaux pour capturer des données sur l’apparition de papillons (Lepidoptera) depuis 2009. Un vaste réseau d’observateurs amateurs utilise un protocole standard basé sur la méthode "Pollard walk" pour saisir ces renseignements sur les feuilles de papier qu’ils transmettent à leur bureau national. Certains de ces bureaux numérisent ces informations dans des feuilles de calcul, mais d’autres n’ont pas les ressources humaines pour le faire et ils envoient les enregistrements papier à l’IBAN pour traitement. L’IBAN produit un rapport annuel basé sur les observations fournies par ces membres nationaux, avec la mise à jour des cartes de distribution et l’analyse des tendances démographiques de certaines espèces clés.
Le siège de l’IBAN est principalement composé de volontaires. Avec la popularité croissante de la science citoyenne et l’intérêt général pour les papillons en tant que groupe d’organismes charismatique, de plus en plus de données sont reçues chaque année et les fiches de données non numérisées s’accumulent rapidement. Le comité directeur de l’IBAN tente d’identifier un flux de travail plus efficace et plus agile pour la création de données numériques, car il souhaite commencer à publier ces données en ligne régulièrement. Ils aimeraient également commencer à traiter des images numériques que leurs bénévoles sont déjà en train de capturer avec des appareils mobiles comme des téléphones et des tablettes. Leur objectif ultime est de faire connaître le réseau et de renforcer les collaborations avec les gouvernements locaux et régionaux pour influencer les politiques de conservation de Lepidoptera dans les pays concernés.
Il n’existe actuellement aucun accord formel entre l’IBAN et les amateurs encodant des données, comme par exemple pour couvrir la manière dont les données peuvent être utilisées. Le comité de pilotage a quelques craintes sur le fait qu’ils devront formaliser cet accord lorsqu’ils commenceront à publier les données en ligne.
Collecte de données
Le protocole recommandé – les marches Pollard – est basé sur des transects de 300 à 600 m de longueur, divisées en sections de 50 m. Chaque transect doit couvrir un seul type d’habitat.
Lors de chaque visite, les opérateurs doivent compter toutes les espèces de lépidoptères qui peuvent être observées à moins de 5 m du transect. Les comportements particuliers (ponte d’œufs ou butinage), ainsi que le stade de développement (par exemple, des larves ou des œufs), devraient également être enregistrés.
Dans la plupart des pays, ces échantillonnages ont lieu une fois toutes les deux semaines, de début octobre à fin juin.
Il y a des mesures de contrôle de la qualité en place : chaque enregistrement signalé est marqué "En attente d’approbation". Le statut de l’enregistrement n’est changé en « Approuvé » qu’après vérification par un expert taxonomique désigné. Les espèces repérées hors de leur saison régulière ou de leur zone de distribution sont signalées pour vérification supplémentaire.
L’heure de la journée et les conditions météorologiques sont enregistrées au début du transect. Le long de ce transect, le nombre d’individus de chaque espèce observée est comptabilisé. Les espèces non identifiées sont comptabilisées et enregistrées, soit au niveau de la famille, soit comme un complexe prédéfini de deux ou trois espèces similaires. Les papillons vus en dehors de la plage de 5 mètres sont enregistrés comme "Extra+le numéro de la section la plus proche" (ex. 5-extra). L’heure de fin du transect est également enregistrée.
Description des données numériques
Certains bureaux nationaux utilisent des groupes de bénévoles pour numériser les archives papier et produire des tableurs numériques. Les tableurs sont très simples et comprennent trois fiches de données. La première capture les informations liées aux efforts d’échantillonnage, la seconde les conditions météorologiques et la troisième les espèces rencontrées et le nombre d’individus observés par l’amateur.
Exercises
Download the exercise sheet. (MS Word, 342 KB)
Exercice 1
Saisie de données
Imaginez que vous êtes un des bénévoles numérisant les archives papier reçues au siège de l’IBAN. Vous avez reçu deux archives papier.
-
Download logs 1 and 2 UC-LS-1-ForCapture.zip. (943 KB)
-
Quelle structure de données utiliseriez-vous pour refléter les données dans ces journaux d’enregistrements ?
-
Créez une feuille de calcul en utilisant cette structure et les données des journaux.
-
Utilisez la feuille d’exercice pour fournir vos réponses et soumettez la feuille de calcul créée à l’étape précédente.
Exercice 2
Gestion des données
En assumant le rôle de l’un des bénévoles possédant des compétences informatiques avancées, imaginez qu’il vous a été assigné la responsabilité des questions de qualité des données. Votre tâche principale est de réduire la quantité de données actuellement rejetées (environ 15 %) avant traitement en raison d’erreurs et d’incohérences. Vous avez reçu un jeu de données en tant que produit brut de l’effort de numérisation.
-
Download UC-LS-2-ForCleaning.xlsx. (44 KB)
-
Évaluez le jeu de données et identifiez quels types d’erreurs il contient.
-
Identifiez différentes façons de corriger ces problèmes, et effectuez ces corrections pour autant d’erreurs présentes que possible.
-
Utilisez la feuille d’exercice pour fournir vos réponses et soumettre la feuille de calcul.
Exercice 3
Publication de données
Pour cet exercice, vous prendrez le rôle de l’expert taxonomique qui collabore avec l’IBAN à son siège. Certaines de vos responsabilités précédentes (rédaction du rapport annuel, et production des cartes de distribution de base) ont été transmises aux volontaires, et une nouvelle responsabilité vous a été confiée : publier les données nettoyées en ligne via le réseau GBIF. Le volontaire responsable de la qualité des données a fourni un jeu de données à publier.
-
Download UC-LS-3-ForPublication.xlsx. (58 KB)
-
Utilisez l’installation IPT indiquée précédemment pour publier le jeu de données fourni.
-
Utilisez la feuille d’exercice pour fournir vos réponses, ainsi qu’un lien vers le jeu de données publié.