BY-COVID Use-case

Goede standaarden, veel connecties

Wanneer we naar het buitenland reizen, kunnen we problemen hebben met het opladen van onze telefoon. Zonder de juiste adapter is het niet mogelijk om onze apparaten aan te sluiten en zitten we snel zonder stroom. Met een universele adapter kan iedereen overal ter wereld reizen. Hetzelfde geldt voor metadata: ongeacht het soort gegevens of de plaats waar ze zijn opgeslagen, met behulp van metadatastandaarden kan iedereen gegevens vinden, openen en gebruiken voor zijn onderzoek.

Wat is metadata? Waarom is het belangrijk om standaarden te hebben?

Metadata zijn "gegevens over gegevens". Niet alle metadata zijn echter nuttig, en normen moeten worden overeengekomen door de onderzoeksgemeenschap en idealiter een reeks richtlijnen volgen die de FAIR-beginselen worden genoemd. Metadatastandaarden helpen bij het opstellen van metadata catalogi om gegevens vindbaar en toegankelijk te maken, en kunnen ook dienen als adapters om gegevens interoperabel en herbruikbaar te maken.

Om een eenvoudig voorbeeld te geven: wanneer je een film zoekt op een streaming platform, vind je informatie zoals het jaar van release, het genre van de film, de regisseur, de duur. Die informatie beschrijft de film en maakt het gemakkelijker om een film te vinden waarin je geïnteresseerd bent en te beslissen of je hem wilt bekijken.

Hetzelfde geldt voor onderzoeksgegevens: als de informatie over de gegevens nauwkeurig en gedetailleerd is, zal het voor een onderzoeker veel gemakkelijker zijn te ontdekken dat de gegevens bestaan en ze te gebruiken voor zijn analyse. Als een onderzoeker twee potentieel nuttige datasets vindt, maar de ene verwijst naar locaties bij naam en de andere bij postcodes, is een metadatastandaard nodig om de gegevens te combineren.

We gebruiken allemaal dagelijks metadatastandaarden: als we onze GPS gebruiken om naar de Eiffeltoren te rijden, moeten we op dezelfde plaats uitkomen, ongeacht de app die we gebruiken. Dankzij goede metadatastandaarden kunnen de app-ontwikkelaars mensen leiden naar waar ze heen willen, of ze nu 'Eiffeltoren', 'Tour Eiffel' of '75007' hebben ingevoerd.

Data moet metadata krijgen vanaf het begin

Het beste boek in de bibliotheek zal niet worden gevonden als het niet op een standaard manier is geïndexeerd. Verschillende items in de bibliotheek hebben verschillende manieren om gevonden te worden. Een tijdschrift heeft bijvoorbeeld een nummer, een boek kan een speciale uitgave zijn, een stripboek kan deel uitmaken van een grotere serie. Hetzelfde geldt voor gegevens: sociale gegevens, medische gegevens en biologische gegevens vereisen allemaal verschillende metadata om ze adequaat te beschrijven.

Normen voor metadata zijn nodig om deze gegevens te vinden, te koppelen en te gebruiken voor onderzoek op verschillende gebieden. Normen voor gegevens en de bijbehorende contextuele en experimentele metadata staan ook bekend als gegevensnormen, metadatastandaarden of inhoudsnormen, en kunnen worden ingedeeld in vier standaard subtypes: rapportagerichtlijnen of checklists, modellen/formaten of syntaxis, terminologie-artefacten, en identificatie schemata.

Het is van essentieel belang dat het vastleggen en standaardiseren van metadata aan het begin van elk onderzoeksproject wordt ingebouwd, voordat de gegevens worden verzameld. Dit zorgt ervoor dat de gegevens hun juiste plaats vinden in een wereldwijd ecosysteem van informatie. Goede metadata verbeteren ook de kwaliteit en de betrouwbaarheid van de gegevens en het vertrouwen in de bevindingen van het onderzoek.

Goede standaarden, veel verbindingen

In het BY-COVID-project zijn er vele gegevensbronnen (bijvoorbeeld databanken, repositories en kennisbanken) uit verschillende onderzoeksdisciplines, waaronder biowetenschappen, klinisch en epidemiologisch onderzoek, en sociale en menswetenschappen. Deze gegevensbronnen worden beschreven in een verzameling FAIRsharing, samen met de gegevens- en metadatastandaarden die door elke gegevensbron worden gebruikt. Er is een gemeenschappelijk metadatamodel ontwikkeld om de metadata in elke bron weer te geven en vindbaar te maken op één plaats: het Covid-19 Data Portal.

De ontwikkeling van een gemeenschappelijk metadatamodel is een grote uitdaging, aangezien bij het project een groot aantal onderzoekers uit verschillende wetenschappelijke domeinen betrokken is, en de gegevensbron van elke partner verschillende metadatastandaarden gebruikt. De aanpak bestaat erin de belangrijkste onderlinge relaties tussen de metadata in kaart te brengen op een manier die zinvol en praktisch uitvoerbaar is. Dit opent dan spannende mogelijkheden om meer te ontdekken over hoe infectieziekten mensen beïnvloeden en om op feiten gebaseerde beleidsvorming te onderbouwen.

Wil je meer leren?

FAIRsharing Educational: leer over standaarden voor data en metadata, hoe het FAIRsharing register gebruikers en producenten van data kan helpen met metadata standaarden, databanken en data policies.

Meer over metadata: Introduction to metadata management

Find out how indexing is used to link data in the BY-COVID project: Release of indexing system to link COVID-19 data across research disciplines

Leer meer over het belang van metadatastandaarden (in het algemeen): 5 Minute Metadata - What is a standard?

Leer meer over het belang van metadatastandaarden in de strijd tegen de COVID-19 pandemie: COVID-19 pandemic reveals the peril of ignoring metadata standards | Scientific Data

Vind hulpmiddelen en richtlijnen om u te helpen bij het verkrijgen van toegang tot, analyseren en delen van gegevens over infectieziekten en om snel te reageren op uitbraken van ziekten: Infectious Diseases Toolkit

BY-COVID - D3.1 - Metadata standards. Documentation on metadata standards for inclusion of resources in data portal | Zenodo

Eerste harmonisatie van gegevens en metagegevens op domeinniveau om snel te kunnen reageren op COVID-19 https://doi.org/10.5281/zenodo.7017728

Leer meer over recepten die je helpen om gegevens FAIR te maken in het FAIR Cookbook, een online bron van praktische recepten voor “FAIR-doeners” in de biowetenschappen.

The FAIR Cookbook - pre-print: “The essential resource for and by FAIR doers”, geeft je meer informatie over het ontstaan en de inhoud.

FAIR, ethical, and coordinated data sharing for COVID-19 response: a review of COVID-19 data sharing platforms and registries | Zenodo

Packaging research artefacts with RO-Crate - IOS Press

Lightweight Distributed Provenance Model for Complex Real–world Environments | Scientific Data

[2205.12098] COVID-19: An exploration of consecutive systemic barriers to pathogen-related data sharing during a pandemic


YOUR THOUGHTS

We'd love to hear what you think about these issues.

For citizens