lördag 5 oktober 2019

Öppen forskning går vidare

I tisdags var det stormöte kring öppen forskning i Helsingfors i Vetenskapernas hus.  Expert- och arbetsgrupper samlades för att jobba tillsammans. Jag är själv ansvarig för arbetsgruppen för länkning av forskningsdata. I det ingår olika saker:


  • hänvisningar till data vid publicering av forskningsresultat (underbyggande evidens)
  • hanteringen av datas livscykel och dokumentation av datas struktur (interna länkningar i data)
  • synligheten av forskningsdata i tjänster för forskningsinformation (CRIS-grafer)

Jag nämnde områdena här i den ordning jag anser att vi bör prioritera dem. De två första punkterna är dessutom förutsättningar för att den sista ska kunna förverkligas. Den sista handlar om information som ofta intresserar framför allt finansiärer, tjänster som OpenAIRE eller den nya nationella tjänsten för forskningsinformation. Det handlar om att sammanställa information om allt från forskningsinfrastrukturer, forskningsprojekt och finansiering till forskare, organisationer och publikationer. Det är visserligen viktig information, som kan användas på många sätt, men för att forskningsdata, som ofta tar stora resurser och också produceras i stora mängder, ska kunna tas med fullt ut, behöver vi lösa många frågor kring hur vi behandlar data som resurs i forskningen.

Det absolut enklaste fallet att beskriva är det vad jag kallat publikation av dataset. Finansiärer förväntar sig idag allt oftare att man vid utgivningen av ett forskningsresultat (i praktiken ofta en artikel) också tillgängliggör underbyggande data och metoder (kod).  Detta argument är enkelt att omfatta också för forskare. Det är klart att man måste kunna belägga sina resultat och de måste kunna granskas. Referenser till data kräver ändå en hel del tekniska lösningar, så som förvaringsplats, tillräckliga metadata och en beständig identifierare. Vanliga webbsidor och webblänkar är inte alls nog i vetenskapliga sammanhang. Vi behöver tjänster som fairdata.fi eller Eudat. Men dessa tjänster passar inte alla. En del institutioner vill ha egna dataarkiv och många områden har internationella lösningar. I praktiken krävs också ofta omfattande planering och dokumentation för att komma så långt att de publicerade data faktiskt duger till något. 

Vår arbetsgrupp färdigställde i tisdags en första version av en rekommendation för hur man ska använda de beständiga identifierare som behövs för att referera till forskningsdataset. Det handlar alltså i detta skede mest om den första punkten: publicering av statiska dataset, som man sedan kan hänvisa till i sin forskning. Med detta skapar vi ändå förutsättningar för punkterna två och tre. Rekommendationen riktar sig alltså till dem som skapar och upprätthåller beständiga identifierare. Det är nämligen verkligen inte alltid lätt att veta när man ska använda hurdana identifierar och på vilket sätt. 

Rekommendationen är mycket koncis och avsikten är att fortsätta arbetet med att förklara och nyansera den i ett annat dokument. Nu har saker ännu reducerats till att man ska göra olika saker (skapa beständiga identifierare, använda semantik i dem osv) med försiktighet eller eftertanke. Vi vill gärna förklara lite mera om hurdana för- och nackdelar som finns med olika alternativ och i vilka olika situationer det är motiverat att avvika från rekommendationen. Dessutom vill vi lyfta fram olika exempel.

I de många diskussionerna under dagen kom jag personligen till en del nya insikter. En var hur otroligt viktigt det är att vi håller fokus på organisationerna och kvaliteten på deras tjänster då vi försöker mäta forskningsdata. Vi måste på alla tänkbara sätt undvika att fokus glider mot att kvantitativt eller schablonmässigt mäta själva data eller forskningens betydelse via data. Med erfarenheten hur åt skogen vi hamnat med missbruket av bibliometri, måste vi inse att vi löper ännu värre risker med datametrik. Data kan man nämligen producera hur mycket som helst om det blir ett mål. Det säger ju inget om dess värde. Och det man mäter får man som bekant.  Kvaliteten kan däremot endast bedömas kvalitativt, av sakkunniga.



Inga kommentarer:

Skicka en kommentar