STANDARDS DE QUALITÉ, NOMBREUX ACCÈS
Lorsque nous voyageons à l'étranger, nous pouvons avoir des difficultés à charger notre téléphone. Sans le bon adaptateur, il n'est pas possible de connecter nos appareils et nous serons rapidement à court de batterie. Avec un adaptateur universel, tout le monde peut voyager partout dans le monde. Il en va de même pour les métadonnées : quel que soit le type de données ou l'endroit où elles sont stockées, les standards de métadonnées permettent à quiconque de trouver, d'accéder et d'utiliser des données pour ses études de recherche.
C’EST QUOI UNE MÉTADONNÉE ? POURQUOI EST-IL IMPORTANT D'AVOIR DES STANDARDS ?
Les métadonnées sont des "données sur les données". Cependant, toutes les métadonnées ne sont pas utiles et les standards (ou normes) doivent être approuvés par la communauté des chercheurs et, idéalement, suivre un ensemble de lignes directrices appelées les principes FAIR. Les normes relatives aux métadonnées contribuent à la création de catalogues de métadonnées pour rendre les données trouvables et accessibles, et peuvent également servir d'adaptateurs pour rendre les données interopérables et réutilisables.
Pour donner un exemple simple, lorsque vous recherchez un film sur une plateforme de streaming, vous trouverez des informations telles que l'année de sortie, le genre du film, le réalisateur, la durée. Ces informations décrivent le film et permettent d’en trouver plus facilement un qui vous intéresse et de décider si vous voulez le regarder.
Il en va de même pour les données de recherche : si les informations sur les données sont précises et détaillées, il sera beaucoup plus facile pour un chercheur de découvrir que les données existent et de les utiliser pour son analyse. Si un chercheur trouve deux ensembles de données potentiellement utiles, mais que l'un se réfère aux lieux par leur nom et l'autre par leur code postal, une norme de métadonnées est nécessaire pour combiner les données.
Nous utilisons tous des normes de métadonnées au quotidien : lorsque nous utilisons notre GPS pour nous rendre à la Tour Eiffel, nous devrions arriver au même endroit, quelle que soit l'application que nous utilisons. De bonnes normes de métadonnées permettent aux développeurs d'applications d'orienter les utilisateurs vers l'endroit où ils souhaitent se rendre, qu'ils aient saisi "Tour Eiffel", "Eiffel Tower" ou "75007".
LES DONNÉES DOIVENT ÊTRE ACCOMPAGNÉES DE MÉTADONNÉES DÈS LA CONCEPTION
Le meilleur livre de la bibliothèque ne sera pas trouvé s'il n'est pas indexé de manière standardisée. Les différents éléments de la bibliothèque ont différentes façons d'être trouvés. Par exemple, un magazine a un numéro, un livre peut être une édition spéciale, une bande dessinée peut faire partie d'une série plus importante. Il en va de même pour les données : les données sociales, les données médicales et les données biologiques nécessitent toutes des métadonnées différentes pour les décrire de manière appropriée.
Les normes relatives aux métadonnées sont nécessaires pour trouver, relier et utiliser ces données pour la recherche dans différents domaines. Les standards relatifs aux données et aux métadonnées contextuelles et expérimentales qui leur sont associées sont également connus sous le nom de standards de données, standards de métadonnées ou standards de contenu, et peuvent être classés en quatre sous-types de standards : lignes directrices ou listes de contrôle pour les rapports, modèles/formats ou syntaxe, artefacts terminologiques et schémas d'identification.
Il est essentiel que la saisie et la standardisation des métadonnées soient intégrées aux plans dès le début de tout projet de recherche, avant la collecte des données. Cela garantit que les données trouveront leur place dans un écosystème global d'informations. De bonnes métadonnées améliorent également la qualité et la fiabilité des données et la confiance dans les résultats de la recherche.
STANDARDS DE QUALITÉ, NOMBREUX ACCÈS
Le projet BY-COVID comprend de nombreuses sources de données (par exemple, des bases de données, des dépôts et des bases de connaissances) provenant de différentes disciplines de recherche, notamment les biosciences, la recherche clinique et épidémiologique, ainsi que les sciences sociales et humaines. Ces sources de données sont décrites dans une collection FAIRsharing (en cours), ainsi que les standards de données et de métadonnées utilisés par chaque source de données. Un modèle commun de métadonnées a été développé pour représenter les métadonnées de chaque source et pour les rendre accessibles en un seul endroit : le portail de données Covid-19.
Le développement d'un modèle de métadonnées commun est un défi majeur, car le projet implique un grand nombre de chercheurs de différents domaines scientifiques, et les sources de données de chaque partenaire utilisent des standards de métadonnées différents. L'approche consiste à cartographier les principales interrelations entre les métadonnées d'une manière logique et pratique à mettre en œuvre. Cela ouvre ensuite des possibilités passionnantes pour en savoir plus sur la façon dont les maladies infectieuses affectent les gens et pour éclairer l'élaboration de politiques fondées sur des preuves.
SI VOUS VOULEZ EN SAVOIR PLUS…
FAIRsharing Educational : découvrez les normes relatives aux données et aux métadonnées, comment le registre FAIRsharing vous aide si vous êtes un consommateur ou un producteur de données, les normes relatives aux métadonnées, les bases de données et les politiques en matière de données.
Plus de détails sur les métadonnées : Introduction à la gestion des métadonnées
Découvrez comment l'indexation est utilisée pour relier les données dans le projet BY-COVID : Release of indexing system to link COVID-19 data across research disciplines
En savoir plus sur l'importance de disposer de standards en matière de métadonnées (en général) : 5 Minute Metadata - What is a standard?
En savoir plus sur l'importance des normes de métadonnées face à la pandémie COVID-19 : COVID-19 pandemic reveals the peril of ignoring metadata standards | Scientific Data
Trouvez des outils et des directives pour vous aider à accéder aux données sur les maladies infectieuses, à les analyser et à les partager, et à réagir rapidement aux épidémies : Infectious Diseases Toolkit
BY-COVID D2.1 : Harmonisation initiale des données et des métadonnées au niveau du domaine pour permettre des réponses rapides à COVID-19 : https://doi.org/10.5281/zenodo.7017728
Apprenez-en davantage sur les recettes qui vous aident à rendre les données FAIR dans FAIR Cookbook, une ressource en ligne de recettes pratiques pour les "faiseurs de FAIR" dans les sciences de la vie. The FAIR Cookbook - pre-print: “The essential resource for and by FAIR doers”, vous fournit de plus amples informations sur sa création et son contenu.
Partage de données FAIR, éthique et coordonné pour la réponse au COVID-19 : une revue des plateformes et registres de partage de données du COVID-19 : FAIR, ethical, and coordinated data sharing for COVID-19 response: a review of COVID-19 data sharing platforms and registries | Zenodo
Packaging des artefacts de recherche avec RO-Crate : Packaging research artefacts with RO-Crate - IOS Press
Modèle de preuve distribué allégé pour les environnements complexes du monde réel : Lightweight Distributed Provenance Model for Complex Real–world Environments | Scientific Data
COVID-19 : Une exploration des obstacles systémiques consécutifs au partage des données relatives aux agents pathogènes pendant une pandémie : [2205.12098] COVID-19: An exploration of consecutive systemic barriers to pathogen-related data sharing during a pandemic