fredag 2 november 2018

Röda, gröna och blå data



Bilden här ovanför har jag vänt och vridit på av och till i ett antal månader och idag fick jag äntligen presentera den offentligt på Informaatiotutkimuksen päivät i Åbo. Tillsammans med ett antal kolleger har vi grubblat över hur vi ska få ordning på olika typer av forskningsdata och tjänster de hänger ihop med. Just nu råder nämligen något av en djungel där man del försöker bygga system för data som snabbt ackulmueras i stora mängder i samma andetag som man vill se till att forskare kan få merit och forskningen bli möjlig att validera genom publicering av små disparata och mycket varierande dataset som ligger som grund för enskilda undersökningar. Det vill inte riktigt lyckas helt enkelt.

Vi kom till att det finns massor av metadataformat och begreppsmodeller och dylikt, men det saknas en gemensam, allmän kategorisering som är överskådlig och stöder hantering av data i praktiken. Så vi gick igenom möjliga sätt att kategorisera data. De olika aspekterna går grovt taget ut på att dela upp data enligt i tekniska, kontextuella och inneboende dimensioner. De två första har vi system för att uttrycka maskinläsbart eller ens delvis strukturerat, men bland de sista finns i synnerhet en dimension som påverkar användningen mycket och som inte är standardiserad i generiska system och tjänster. Det handlar just om datas stabilitet. Det finns aktiva data, generiska forskningsdata och specifika datapublikationer. 

Jag tror fast på att en dylik tredelning hjälper oss vidare då det gäller att utveckla tjänster och system för dokumentation, citat, beständiga identifierare och planering av datahantering.  Så jag hoppas jag kan kavla upp ärmarna mycket snart.

Hela resonemanget presenteras i Informaatiotutkimus decembernummer.

Inga kommentarer:

Skicka en kommentar