söndag 13 oktober 2019

Samlingar som forskningskällor


Modell av Uppsala som vi kunde beundra då vi besökte Fyriskällan,
där stadsarkivet och folkrörelsearkivet härbärgerar vid sidan av biblioteket.

Digitaliseringen har inom kulturarvssektorn inte bara inneburit att man digitaliserar samlingarna, utan det har indirekt lett till mycket ny utveckling. Bland annat har en öppenhets- och konvergenstrend lett till att man nu når ut till allmänheten på nya, engagerande sätt och nya medier har också gjort erfarenhets- och narrationstänket starkare. Nästan alla traditionella kategoriseringar är utmanade. Samtidigt har forskarsamfundets behov och förväntningar ändrats. Förutom att forskare använder digitala material på kanske oväntade sätt, har intresset för föremålen i sig själva vuxit bland åtminstone historiker.

För forskare är det viktigt att kunna utnyttja alla material, också de digitala. Att kunna hänvisa till digitala källor blir allt viktigare, liksom att kunna dokumentera datas livscykel. De digitala material som produceras inom arkiv, bibliotek och museer borde också kunna fungera som forskningsdata. Att betjäna forskningen är ett av sektorns viktiga uppdrag. Men forskarnas sätt att använda data är mycket varierande. Om detta och en del annat talade jag i veckan på ett seminarium för akademiker inom området.

 

lördag 5 oktober 2019

Öppen forskning går vidare

I tisdags var det stormöte kring öppen forskning i Helsingfors i Vetenskapernas hus.  Expert- och arbetsgrupper samlades för att jobba tillsammans. Jag är själv ansvarig för arbetsgruppen för länkning av forskningsdata. I det ingår olika saker:


  • hänvisningar till data vid publicering av forskningsresultat (underbyggande evidens)
  • hanteringen av datas livscykel och dokumentation av datas struktur (interna länkningar i data)
  • synligheten av forskningsdata i tjänster för forskningsinformation (CRIS-grafer)

Jag nämnde områdena här i den ordning jag anser att vi bör prioritera dem. De två första punkterna är dessutom förutsättningar för att den sista ska kunna förverkligas. Den sista handlar om information som ofta intresserar framför allt finansiärer, tjänster som OpenAIRE eller den nya nationella tjänsten för forskningsinformation. Det handlar om att sammanställa information om allt från forskningsinfrastrukturer, forskningsprojekt och finansiering till forskare, organisationer och publikationer. Det är visserligen viktig information, som kan användas på många sätt, men för att forskningsdata, som ofta tar stora resurser och också produceras i stora mängder, ska kunna tas med fullt ut, behöver vi lösa många frågor kring hur vi behandlar data som resurs i forskningen.

Det absolut enklaste fallet att beskriva är det vad jag kallat publikation av dataset. Finansiärer förväntar sig idag allt oftare att man vid utgivningen av ett forskningsresultat (i praktiken ofta en artikel) också tillgängliggör underbyggande data och metoder (kod).  Detta argument är enkelt att omfatta också för forskare. Det är klart att man måste kunna belägga sina resultat och de måste kunna granskas. Referenser till data kräver ändå en hel del tekniska lösningar, så som förvaringsplats, tillräckliga metadata och en beständig identifierare. Vanliga webbsidor och webblänkar är inte alls nog i vetenskapliga sammanhang. Vi behöver tjänster som fairdata.fi eller Eudat. Men dessa tjänster passar inte alla. En del institutioner vill ha egna dataarkiv och många områden har internationella lösningar. I praktiken krävs också ofta omfattande planering och dokumentation för att komma så långt att de publicerade data faktiskt duger till något. 

Vår arbetsgrupp färdigställde i tisdags en första version av en rekommendation för hur man ska använda de beständiga identifierare som behövs för att referera till forskningsdataset. Det handlar alltså i detta skede mest om den första punkten: publicering av statiska dataset, som man sedan kan hänvisa till i sin forskning. Med detta skapar vi ändå förutsättningar för punkterna två och tre. Rekommendationen riktar sig alltså till dem som skapar och upprätthåller beständiga identifierare. Det är nämligen verkligen inte alltid lätt att veta när man ska använda hurdana identifierar och på vilket sätt. 

Rekommendationen är mycket koncis och avsikten är att fortsätta arbetet med att förklara och nyansera den i ett annat dokument. Nu har saker ännu reducerats till att man ska göra olika saker (skapa beständiga identifierare, använda semantik i dem osv) med försiktighet eller eftertanke. Vi vill gärna förklara lite mera om hurdana för- och nackdelar som finns med olika alternativ och i vilka olika situationer det är motiverat att avvika från rekommendationen. Dessutom vill vi lyfta fram olika exempel.

I de många diskussionerna under dagen kom jag personligen till en del nya insikter. En var hur otroligt viktigt det är att vi håller fokus på organisationerna och kvaliteten på deras tjänster då vi försöker mäta forskningsdata. Vi måste på alla tänkbara sätt undvika att fokus glider mot att kvantitativt eller schablonmässigt mäta själva data eller forskningens betydelse via data. Med erfarenheten hur åt skogen vi hamnat med missbruket av bibliometri, måste vi inse att vi löper ännu värre risker med datametrik. Data kan man nämligen producera hur mycket som helst om det blir ett mål. Det säger ju inget om dess värde. Och det man mäter får man som bekant.  Kvaliteten kan däremot endast bedömas kvalitativt, av sakkunniga.söndag 29 september 2019

Dataarkivet i Tammerfors fyllde 20 år

På tisdagen ordnade Samhällsvetenskapliga dataarkivet ett lyckat seminarium i Tammerforshuset. Dataarkivet är en verklig föregångare då det gäller att stöda produktion och återanvändning av forskningsdata i vårt land. Deras webbsidor och tjänster har länge erbjudit information och stöd för hur man ska gå tillväga för att handla etiskt och se till att forskningen resulterar i underbyggande dataset som inte bara fungerar som evidens, utan också kan användas av andra forskare. Deras verksamhet visar tydligt vad skillnaden är mellan ett riktigt dataarkiv och en webbtjänst, där forskare själva kan ladda upp och publicera dataset. Det senare ofta med den följden i förlängningen att e-postadresserna föråldras, vilket är förödande för användbarheten, eftersom forskare som vill återanvända data inte sällan vill ha kontakt med upphovspersonerna. Det är inte bara data som behöver kurateras, utan också metadata, och dessa är processer som måste fortgå efter publiceringen om man vill att data ska vara användbart i längden. Det är kanske inte alltid fallet att det måste ske, men man borde göra medvetna val om saken i ett tillräckligt tidigt skede.


Johanna Vehkoo berättade i det fina auditoriet om falska nyheter .

Föredragen på jubileumsseminariet höll hög nivå. Journalisten Johanna Vehkoo berättade bland annat om projektet Huhumylly, och hur falska nyheter ofta är xenofoba rykten som inte sällan består i importerade lögner. De förvandlas ofta till lokalt skvaller och det är direkt pinsamt att man i Finland inte har bättre immunitet mot dylikt, trots god läskunnighet, skola o.s.v. Tvärtom verkar vi ju ha mycket fördomar och okunskap. Hon påminde om vikten av att använda sig av bildsökning, eftersom det hos oss (också) är vanligt att man sprider gamla bilder i samband med nya "nyheter". Hon underströk också vikten av att vara kritisk mot ljud- och videomaterial på webben av samma orsaker. Dessutom är det ju idag enkelt att göra direkta förfalskningar.


Dekan Juho Saari höll en ytterst informativ föreläsning i välfärdsforskning från Erik Allardts tidigare arbeten till i dag. Det blev en utmärkt grundkurs för mig, måste jag säga. Jag tror åtminstone att jag nu har en betydligt bättre uppfattning om vad det handlar om. Vidare talade professor Hanna Wass om de problem som uppstått med tolkningar av GDPR för registerforskningen. Det hela verkar med jämna mellanrum drabbas av överslag som inte gynnar någon. Man önskar att lagens anda skulle kunna förverkligas så att man faktiskt beaktar allmänintresset som en vägande faktor i ekvationen och förstå att man in registerforskning inte är ute efter profilering med liknande manipulativa vinstsyften som kommersiella aktörer håller på med som legio. Enskilda tjänstemän borde inte behöva panikera  och komma med orimliga tolkningar för att de annars förlorar nattsömnen. Vi borde från offentligt håll stöda forskningen också genom att skapa goda förutsättningar för att producera faktabaserad information som kan underbygga vettig och effektiv samhällspolitik.


lördag 21 september 2019

Open Science Fair i Porto

Mina flyg gick till och från Lissabon, så jag tog tåg till Porto.
Det var enkelt och intressant.


Denna vecka besökte jag Portugal första gången i mitt liv. En angenäm upplevelse, måste jag säga. Det var många workshoppar och sessioner och många intressanta samtal. Professionellt kan jag säga att särskilt Paola Masuzzos presentation keynote var inspirerande, medan sessionen om forskningsevaulering knäckande klar kring hur sega strukturer och korkade system vi har att kämpa emot. Rekommenderar att man kollar presentationerna om man är intresserad. Men det är beklämmande hur överens man är om att all världens index är värdelösa, men ingen vågar frångå missbruket. Kanske Dora ändå kan ha en effekt över tid, men forskarna har mycket på spel och förtroende är inte lätt att bygga upp för nya metoder av utvärdering.

Också mitt nuvarande projekt hade en session och deltog i att arrangera en om beständiga identifierare (PID). Vad som behövs är mera arbete med semantisk interoperabilitet, det stod klart. Och vettig och utbredd användning av identifierare.
söndag 16 juni 2019

Herman, den siste uronkeln, är borta

När Herman fyllde hundra år för ett par år sedan samlades släktingar från många länder på Hagaro. Några, som inte kunde närvara, deltog per Skype, och Herman, vars närminne redan var borta, skålade glatt med de ryska släktingarna via datorn. När han i något skede blev påmind om festens orsak ropade han högt, med ett kännspakt parlandskt samtidigt roat och chockerat tonfall: "Hundra år! Det är ju förskräckligt!"
Herman och Birgitta var ett begrepp i min barndom. Herman var den av mina uronklar, som de kallade sig, som jag kände bäst. Henry dog ju redan 1930 och Ralf bodde i Sverige så länge jag minns. Herman var den yngsta brodern, och också den som levde sundast och det är därför kanske inte så konstigt att han blev 102 år gammal. När han började i Grankulla samskola 1926 var han nio och alla bröderna gick en tid i samma skola. Storabröderna hörde inte precis till de lugnaste och mest välanpassade. De var mycket aktiva och kreativa, inte sällan bråkiga. Jag har hört berättas hur "PARLAND! UT!" ekade från olika håll i skolan inte långt efter inringningen. Till stökigheten bidrog säkert pojkarnas i början svaga kunskaper i svenska och den rysstämpel som de tilldelats, trots sitt tyska modersmål. Herman var, vad jag förstått, inte alls en bråkstake, trots att han besatt samma livliga intellekt, nyfikenhet och den egensinnighet man kan ta del av i Georg Grotenfelts underbara Hermanfilmen.

Familjen Parland hade flyttat till Grankulla 1922. Min farfar Oscar har skrivit om hur pojkarna lekte på bergen söder om järnvägen och ett minne, som Herman berättade för mig för inte länge sedan, handlade om hur han som mycket liten hade det dagliga uppdraget att föra lunchvälling till sina bröder i skolan. Han tyckte det var orättvist. Att hans mor dessutom helt bröt mentalt samman efter Henrys död, när Herman var i trettonårsåldern, måste ha varit tufft. Den besvärliga barndomen kompenserades kanske förhoppningsvis av det nästan livslånga äktenskapet med Birgitta, ett förhållande som åtminstone utåt tedde sig som mycket varmt och fyllt av ömsesidig respekt, trots de olika personligheterna.

Herman gick sin egen väg, närmast faderns, och blev professor i byggteknik och expert i statik. Jag minns hur han för länge sedan talade varmt för trä som byggmaterial och hur han skarpt gillade Heidi Hautala. Han var en modig och självständig tänkare, som alltför ofta reducerats till den yngre brodern till de intressanta författarbröderna. Han var i själva verket den som var mest berest, hade de bredaste nätverken och aktivaste kontakterna till de utspridda släktingarna, ägde den största kunskapen om släktens historia och dessutom var en internationellt publicerad forskare. Han skrev om allt från "elasticitetsteorins variationsprinciper" till sten-, betong och stålkonstruktioner och historia. Och gillade alltså trä. Fast jag har ett vagt minne av att han vägrade gå ut i burspråket på Furugård hos Arne Runeberg, eftersom han ansåg att konstruktionen omöjligt kan hålla.lördag 8 juni 2019

ArtblomningI skolan fick ännu jag lära mig, att definitionen av en art är att två individer kan producera en fertil avkomma. I dag har vi kunskapsmässigt kommit långt från Linnés taxonomiska system som enkel tolkning av naturens ordning. Problemet med alla klassificeringar är ju att de i regel läcker och inte räcker för att beskriva verkligheten på ett kategoriskt sätt, särskilt i komplexa sammanhang.  Genetiska studier har spjälkt och sammanlänkat arter på nya sätt och numera är artbegreppet mer finfördelat och flytande. Också människans gener är ju en salig röra av evolutionära hopp. Gener hoppar hit och dit, har vi lärt oss, så att också biologerna numera jobbar utgående från mindre enheter än arter eller underarter. Man talar istället om fenotyper, kluster, haplogrupper och alla möjliga andra begrepp som bättre beskriver den komplexa mångfald naturen utgör.
En underbart vacker illustration av detta kan man just nu se i Alprosparken. Till Finland har man i tiden hämtat rhododendronmaterial ända från Korea, men man har nu tagit fram flera olika härdiga sorter genom samarbete med bland andra Mustiala och Brödtorp. I Haga har man planterat tusentals hybrider. Färgprakten är förstummande, dofterna bedövande, sedan man på 1980-talet utvidgade till azaleor. Hela mångfalden i ett litet snitt av växtriket manifesterar på ett underbart sätt hur svart-vitt, antingen-eller tänkande inte räcker nån vart. Och det har man vetat i sekler bland dem som arbetar med förädling. Raser. Bah.


torsdag 30 maj 2019

Inkluderande digitalisering

Av en händelse blev jag utsedd till koordinator för tillgänglighet på jobbet. Det har tagit mig på ett intressant spår och jag har fått lära mig mycket nytt de senaste månaderna. Allt började ju egentligen med ett EU-direktiv som trädde i kraft redan för över två år sedan, och som sent omsider ledde till en uppdatering av den finska lagstiftningen i våras. Enligt den nya lagen måste offentliga digitala tjänster efter en övergångstid vara tillgängliga för en större del av befolkningen. Det är en fråga om jämlikhet, att man gör också digitala miljöer sådana, att människor med olika slag av handikapp, tillfälliga eller bestående, kan ta del av dem.

Allra mest handlar det bara om att man har den kompetens som behövs, att göra saker på rätt sätt och inte av ren okunskap göra en webbplats möjlig att använda för någon som inte kan se eller har svårt att använda en mus. Digitala redskap erbjuder fina möjligheter bara man använder dem. Med lite omsorg kan en tjänst vara tillgänglig för så många fler. Dessutom är tillgänglig design allmänt taget användarvänlig och smart. Vi är många som uppskattar till exempel en redig layout, klart språk, tillräcklig kontrast och text på video.

För att kunna delta i arbetsliv och studier behöver man idag i praktiken alltid datorer. Också blinda människor kan bra använda dem. Men då förutsätter det att utvecklarna inte har gjort dumheter som att använda html-koden på ologiska sätt, genom att till exempel använda title- och header-taggar fel, eller glömt att kolla att man kan använda sidan utan mus. Också de som producerar innehåll borde tänka på till exempel hur man formulerar länkar och alt-texter eller hurdana filer man laddar upp. De måste innehålla relevant information, inget annat. Också andra handikapp kan och bör beaktas med lite eftertanke. Efter ett armbrott kan vem som helst behöva använda datorn med en hand en tid.

Det är Södra Finlands regionförvaltningsverk som övervakar och informerar om webbtillgänglighet. Det är ju ingalunda så, att bara de som lagen förpliktar borde följa dessa goda metoder. Det handlar ju helt enkelt om att göra kvalitet, och också om att kunna nå ut och betjäna flera människor. När som helst kan vi själva eller våra närmaste vara beroende av att någon gjort sig det lilla extra besväret att tänka efter lite. Och firman som dissade kunden som inte kunde sända in sin beställning missade affären.

Här en reklamvideo som visar ett hjälpmedel, ett Braille-gränssnitt. 
Ett annat sätt att bekanta sig är att testa en skärmläsare. Man inser snabbt hur annorlunda den digitala världen ter sig för en som inte ser ...