Data samenvoegen uit verschillende onderzoeken is ingewikkeld. Dankzij slim databeheer verandert dat.
‘Als je onderzoek met al bestaande data wilt doen, dan stoot je heel vaak je neus. Je kunt niet vinden wat je zoekt of hebt geen toegang. Vaak sluiten de gegevens ook niet op elkaar aan. Daar wilden we iets aan doen.’ Marco Roos, onderzoeker in een internationaal consortium onder leiding van LUMC-hoogleraar Barend Mons, schetst de ontstaansgeschiedenis van FAIR in 2014. Nu doet Roos bij Humane genetica van het LUMC onderzoek naar de implementatie van deze principes.
‘De tijdsbesparing is veel groter dan de extra inspanning’
Het idee achter FAIR is dat gegevens uit verschillende onderzoeken vindbaar (findable, F), toegankelijk (accessible, A), interoperabel (interoperable, I) en herbruikbaar (reusable, R) moeten zijn voor computer en mens. Onderzoekers hoeven niet allemaal dezelfde labtools te gaan gebruiken, zolang het databeheer maar volgens dezelfde principes werkt. Roos: ‘Onze bioinformatici zijn nu soms driekwart van hun tijd bezig om datasets bruikbaar te maken. Zij zouden willen dat labonderzoekers anders met data omgaan. Dat is lastig, want die hebben dat voor hun eigen werk lang niet altijd nodig.’ Hier ligt een belangrijke uitdaging voor FAIR-onderzoekers zoals Roos. ‘We willen dat het haast onmerkbaar gebeurt, zonder extra werk bij het invoeren, maar zo ver zijn we nog niet. Toch is de winst groot. De tijdsbesparing is namelijk veel groter dan de extra inspanning aan de bron.’
Onderzoekers op één lijn krijgen is daarom een kwestie van tijd, maar geldt dat ook voor fabrikanten van software en hardware? Hun producten moeten dan immers ‘communiceren’ met producten van de concurrent. Roos ziet nog wel weerstand, maar ook een kentering. ‘Verkopers zeggen wel eens: “Wij zijn helemaal FAIR, zolang je alles met onze tools doet.” Zo werkt het niet. Als onderzoeksinstituten er steeds meer om vragen, dan gaan ze wel mee.’
Zeldzame ziektes
FAIR databeheer is voor onderzoek naar zeldzame aandoeningen van grote betekenis. ‘Hoe zeldzamer de ziekte, hoe meer je afhankelijk bent van de gegevens die er zijn, verspreid over ziekenhuizen en andere bronnen’, legt Roos uit. ‘Probleem bij zeldzame ziektes is dat individuen gemakkelijker te traceren zijn als je alle data naar één plek zou brengen. Daarom wil je de gegevens aan de bron standaardiseren en geschikt maken voor verder onderzoek óver instituuts- en landsgrenzen heen.’
Roos werkt daarom in Europees verband aan netwerken van expertisecentra voor zeldzame aandoeningen. Het idee is dat artsen van die centra gemakkelijker expertise kunnen uitwisselen om patiënten te helpen. Ook voor wetenschappelijk onderzoek kunnen patiëntgegevens dan goed worden geregistreerd. ‘Dat is hard nodig’, vertelt Roos. ‘We kunnen soms nog niet eens goed tellen hoeveel mensen een ziekte of een bepaald symptoom hebben. Die gegevens zijn wel aanwezig bij ziekenhuizen, maar niet beschikbaar voor analyse, soms zelfs niet binnen het eigen ziekenhuis.’
De hoeveelheid tijd en inspanning, die zit tussen het stellen van een vraag en het beantwoorden ervan, kan dus behoorlijk omlaag. ‘Het onderzoek verschuift dan van gedoe met data, naar daadwerkelijk onderzoek doen’, zegt Roos. ‘Als FAIR de internationale standaard wordt in datamanagement, dan kunnen ook mensen buiten universiteiten een vraag stellen en die beantwoorden. De Nationale Wetenschapsagenda is heel mooi, maar het duurt jaren om die vragen te beantwoorden. Ik denk dat dit straks veel sneller kan.’
Dit artikel is op 10 maart 2020 verschenen in C2W, vakblad voor chemie en life sciences
Meer artikelen in C2W
Foto bovenaan: DARPA/ public domain
Tags