söndag 26 april 2015

Konsten att vara kritisk

Kevin har i dag en bra text igen. Inte för att jag kan uttala mig särskilt mycket om hur väl hans beskrivning överensstämmer med hur jag skulle beskriva valprogrammen i år. För jag har sedan några år helt slutat se på valdebatter och andra program inför valet. Jag blev så fruktansvärt knäckt och irriterad på den nivå debatterna hade. Och det allra mest just på grund av det fenomen Kevin skriver om, debattledarnas arroganta inställning till både politiker och väljare, som dessutom fick debattdeltagarna att bete sig som en skock idioter och skrika i munnen på varandra. Det var inför EU-valet jag tänkte: "Herregud, är det faktiskt människor vars debattförmåga är på denna nivå vi ska skicka till EU-parlamentet och sköta viktiga frågor?" Jag fick just ingen riktig ny information om någonting. Slut på teve-debatterna för min del.

Jag tror det var reklamteve som började med denna "tuffa" linje, där huvudmålsättningen verkade vara att sätta politikerna på plats och tvinga fram förenklade och onyanserade jo/nej-svar för att få fram "skillnader". Ett koncept som verkligen bäddar för populism och dumheter, och helt befriar journalisterna från att till exempel ha full koll på fakta eller att ställa mer krävande följdfrågor för att klarlägga eventuella brister i argumentationen. Eller helt enkelt låta väljarna dra sina egna slutsatser om politikernas kompetens, värderingar och tankeförmåga.

Det är just det som Kevin så väl lyfter fram: att vi behöver få höra berättelserna, vi behöver höra logiken, argumentationen, vad som är viktigt, vad som utelämnas i resonemangen. Det vi behöver hjälp med är faktakoll och med kritisk granskning, saker som kan skötas med sakliga följdfrågor. Korrigerade debattledarna sakfel i år eller ställde de följdfrågor för att klarlägga brister i argumentationen?

Som sagt kan jag inte uttala mig alls om hur det har varit de senaste åren. I år tog jag i stället första gången på riktig hjälp av ett kandidattest på nätet, men då var det förstås de öppna svaren som hjälpte mig att välja mellan några alternativ. Hbl hade också inför valet sammanställt ganska intressanta tabeller om partiernas ståndpunkter i olika frågor.

Men generellt är detta med kritik tydligen svårt. Många ungar verkar tro att kritik betyder det samma som att säga emot allting av princip. Det är lite tragiskt om för samhället avgörande debatter i teve är på samma intellektuella nivå. Det enda det signalerar till väljarna är att alla är dumma i huvudet (både politiker och journalister) eftersom de inte kan uttala sig nyanserat om en enda komplex fråga, alternativt att de vägrar ge klara svar och bara verkar svamliga. Man serverar en mycket svartvit tolkning av alla frågor för dem som är mottagliga för sådant. Jag har svårt att se vem det tjänar. Annat än populister.

Riktigt bra kritisk journalistik sysslar man med på Faktabaari. Det är sådana kommentarer debattledare och intervjuare gärna kunde komma med direkt under debatten. Sådant kunde faktiskt föra diskussionen framåt. Nu kommer politikerna alltför ofta undan med halvsanningar och osanningar i sina korta svar, misstänker jag. Följande viktiga steg skulle ju vara att man tar diskussionen vidare med den som farit fram med osanna påståenden och ber folk analysera hur det korrekta faktaunderlaget påverkar deras resonemang. Men förhoppningsvis får redan hotet om att någon faktiskt bryr sig om att kolla fakta beslutsfattarna att lite tänka efter.

fredag 24 april 2015

Språkteknologer och lingvister sopar golvet med (andra) digihumanister

Vid Åbo Universitet har man grundat ett nytt forskarnätverk Digin för forskare i digital interaktion. Jag hade i dag nöjet att där få predika om vikten av informationsförvaltning, forskningsdata och öppen forskning. Jaakko Suominen höll ett intressant inlägg om sin teknologihistoriska forskning och vi kom in på frågor om var gränsdragningen egentligen går mellan forskningsmaterial och -metod.

Resten av presentationerna, vid sidan av en infoslot om bibliotekets lysande Forskarguider, var språkvetarnas segertåg. Korpusarna är och kommer att vara en viktig resurs för humanister eftersom man redan länge arbetat med kvantitativa metoder och digitala material. Man har etablerade standarder och metoder, kompatibla system och resurser och fungerande nätverk. Vi andra humanister bygger ännu alltför ofta silon, egna små materialset som är svåra att kombinera med andra material eller återanvända för andra syften.

Ett stort problem vi har är upphovsrättslagen, som starkt begränsar användningen av moderna material till och med i forskningssyften. Frustrationen var stor i dag också, och större torde den bli om inte lagstiftarna snart får ändan ur vagnen. Europeiska forskare är verkligen i lä, eftersom det enda sättet man i större utsträckning kan dela data som intresserar humanister ofta är just som snuttifierade material som nog duger då man man vill forska i språket, men som gör det omöjligt att göra den typen av kontextuell analys och utvärdering som övriga kultur- och samhällsforskare behöver kunna göra. När till och med gruvdrift i textmassor kräver att man står på huvudet är vi nog lite på lösa boliner i Europa. Och det löjligaste är ju att ingen vinner, alla förlorar. Men det görs mycket intressanta korpusar och metoderna utvecklas i snabb takt.

Trots att alla datorer varit jobbiga med mig i dag är jag ändå uppåt på grund av det växande intresset för dessa frågor och de intressanta föredrag och diskussioner som fördes i dag. Och dessutom är det fredag. Inte illa.


tisdag 21 april 2015

Att göra omelett

I dag ordnade Finna ett seminarium om användbarhet. För dem som arbetar med informationssystem och forskare är materialet säkert värt att bekanta sig med. Som väntat var seminariet både intressant och givande, eftersom man arbetat mycket och framgångsrikt med dessa frågor inom Finna. Seminariet inleddes med en genomgång av användningen av Finna, som har ett flertal olika gränssnitt, både det nationella, som ger tillgång till samtliga material, och organisationers anpassade egna vyer, såsom Helsingfors stadsmuseums eller Jyväskyläs universitets. Konceptet är enligt min mening lysande.

Heikki Sarvamaa presenterade en grundlig undersökning som gjorts om hur forskare från olika områden söker information i Finna. Generellt konstaterade Sarvamaa att forskare beter sig som gemene googlare då de söker: man börjar med att testa sig fram, utvärdera sökresultaten och avgränsa och specificera söktermerna an efter. Det fanns uppenbara skillnader mellan olika discipliner vid kartläggning av potentiella forskningsområden och -frågor: medan forskare inom de exakta vetenskaperna söker luckor att fylla, rotar humanister och samhällsvetare i forskningen för att genom att mer på måfå bläddra igenom forskning och söka efter frågor som verkar erbjuda intressanta nya infallsvinklar. Han konstaterade också att forskare känner stor osäkerhet eftersom det finns så många olika söktjänster (som dessutom kan ge radikalt olika sökresultat); man undrar över vilka material som egentligen finns var och i vilken mån de t ex överlappar varandra och vilka skillnaderna egentligen är.

Liksom Sarvamaa konstaterade också följande talare, Annikki Roos, att forskare är mycket nöjda med Google Scholar och man använder både Google och Wikipedia flitigt. Roos har forskat i medicinares informationsbeteenden och konstaterar att de i stort sett 100%:igt använder sig av PubMed, andra tjänster har mycket litet att erbjuda. Till mer allmänna sökningar duger Google Scholar och Wikipedia, som faktiskt kan innehålla färskare information än etablerade vetenskapliga kollegialt granskade tidskrifter. Yngre forskare tenderar dessutom strunta i att följa med "viktiga tidskrifter", utan använder sig i stället av bevakningstjänster (vilket, som randanmärkning sagt, ytterligare torde tära allvarligt på de överprissatta tidskrifternas fortsatta monopol). Vidare uttryckte också hon en hel del oro för forskarnas kompetenser vad gäller hanteringen av forskningsdata. Hon hade noterat samma sak som undertecknad: att ingen frågar bibliotekarierna, utan man gör som handledaren säger att man ska göra. Roos gick till och med så långt att hon sade att man borde satsa sitt krut på att utbilda äldre forskare snarare än bibliotekarier. Det finns inget effektivare sätt att påverka kulturen inom en forskningsdisciplin. Och förstås: bibliotekarierna måste ut och arbeta med forskarna.

Den efterföljande diskussionen handlade bland annat om hur Finna egentligen borde profilera sig. Jag uttryckte tanken om att det inte är vettigt att försöka tävla med tjänster som PubMed, utom möjligen som resurs för inhemsk forskning, utan snarare betjäna humanister och samhällsvetare. Dessa har en redan stor del av sina relevanta material sökbara via Finna i och med att man samlar arkiv-, muse- och biblioteksresurser där. Dessutom pläderade jag i ganska kraftiga ordalag för att man borde öppna för crowdsourcing i mycket högre grad. I synnerhet i arkiven finns så mycket material som inte är beskrivna med ämnesord, att arkivpersonal aldrig kommer att kunna göra dem sökbara på det sätt som dagens och i synnerhet morgondagens "bekväma" forskare kräver. Dessutom erbjuder Finna som samlade resurs en möjlighet att på ett värdefullt sätt länka relaterade material som finns i olika samlingar. Jag påpekade också att det skulle vara en bra lösning att dessutom använda sig av Wikidata och Wikipedia som medel för denna länkning. Man berättade att man testat på att ta fram artiklar om upphovsmän från Wikipedia, men att man tagit bort funktionen, eftersom det kommit klagomål om att man visat felaktig information. I det skedet blev jag lite nervös och påpekade att sådant enkelt kunde korrigeras genom att ge användarna möjlighet att bekräfta eller dissa förslag på relaterade Wikipediaartiklar. Lite spydigt kommenterade jag att det säkert varit någon bibliotekarie som klagat på saken. Det var på sätt och vis orättvist, eftersom det förstås är deras jobb att värna om kvaliteten på metadata. Men samtidigt har vi absolut ett ägg som behöver krossas här, för att vi ska kunna få till stånd en omelett.

Att "släppa in" metadata av sämre kvalitet i systemen innebär nämligen inte att man dissar vikten av professionella människors kompetens och arbete. Tvärtom. Det behövs absolut kvalitetskontroll, yrkesstolthet och en viss tröghet i systemet. Också. Men vi behöver samtidigt desperat utnyttja den sakkunskap och det engagemang som finns utanför väggarna på dessa ärevördiga och viktiga institutioner. Man kan absolut hålla i sär olika kategorier av metadata på ett sätt som också en lekman förstår. I själva verket kunde Finna, men sitt goda kunnande gällande användbarhet, just precis lansera ett koncept för hur detta görs. Man kunde också målmedvetet börja bygga upp Finna till en mycket rik och länkad, crowsourcead, resurs. Därifrån kunde organisationer sedan hämta tillbaka den information de vill, om de vill. Då kunde man också befria arkiv och museer, åtminstone de minsta, från våndan och besväret att testa sig fram med dylika saker. Nationalbiblioteket har också utvecklat konceptet på ett bra sätt för sina digitaliserade material.

Så jag hoppas att man inte missförstod min kritik och vilka ägg det är jag vill slå sönder. Men som Annikki Roos också sade, bibliotekarierna behöver bädda in sig och delvis se över sin roll i forskningssamfundet. Den är nämligen viktigare än någonsin förr.

Nationalbiblioteket har utvecklat ett system
som stöder användaren att indexera på ett välstrukturerat sätt.




torsdag 16 april 2015

Tjat, tjat - om varför länkad data är viktigt

DemoticScriptsRosettaStoneReplica.jpg
"DemoticScriptsRosettaStoneReplica" by Chris 73 / Wikimedia Commons. Licensed under CC BY-SA 3.0 via Wikimedia Commons.


I dag hade vi ett jätteintressant heldagsseminarium på jobbet om långsiktigt digitalt bevarande (LDB) av forskningsmaterial. Många, många intressanta frågor dök upp och diskussioner fördes. Vad gäller forskningsdata anser jag att de största utmaningarna är administrativa: vi behöver en struktur för att hantera bevarandeplanering etc för olika områden och en fungerande arbetsfördelning gällande olika processer i sammanhanget. Den andra stora utmaningen är att överhuvudtaget få forskarna att engagera sig i sin datahantering och tillmäta data tillräckliga resurser och tillräckligt värde. Får vi dessa två bitar på plats har vi kommit mycket långt. En viktig poäng är, tycker jag, att forskare själva inte behöver befatta sig med långsiktigt bevarande. Det ska ordnas av forskningsorganisationer, dataarkiv och staten. Inget extra arbete behövs av forskarna för den biten, bara vad som borde vara normalt förvaltande av forskningsinformation. Men där finns en del att göra, både var gäller kompetens och motivation.

En annan sak som lite relaterar till frågan är den om värdering och prioritering av data. LDB är dyrt och vi måste prioritera. Det borde göras av forskarsamfundet. Det talas mycket om mätare och altmetrik och det gör mig lite kallsvettig. Visst, att data laddats ner mycket tyder på att det har en viss betydelse (en hel data laddas t ex ner för undervisningssyften). Sådan data är troligen användbar. Men det säger nödvändigtvis inget alls om dess värde: om det kostat massor av pengar att producera, om det är helt unikt och oersättligt, fyller en viktigt nisch t ex i ett internationellt perspektiv eller om det kanske är just precis det dataset som laddas ner av en forskare som gör en upptäckt som räddar mänskligheten eller sparar samhället enorma resurser om tjugo år.  Dessutom är det dumheter att man kunde jämföra olika typer av data: en viss typ av data kan generera tusentals "nedladdningar" på en gång, medan något jättelikt dataset kan se ut som ett enda. Och inte går det att räkna bittar heller. Kort sagt: SLUTA RÄKNA! Det är bortkastad energi att försöka dra större slutsatser på basis av citat eller annan statistik. Och ännu värre, det kan ge en skenbar känsla av objektivitet, som kan få direkt förödande följder.


Men det var inte det jag skulle skriva om heller, egentligen, utan jag ville tjata lite om vikten av länkad data och semantisk webb. Digital humaniora växer kraftigt och "genren" har länge dominerats av våra duktiga lingvister. Men i dag börjar också andra kultur- och samhällsforskare av olika slag vakna upp till den digitala teknologins möjligheter. Det innebär att vi behöver börja beakta vad saker betyder i högre grad än förr. Och det betyder kort sagt semantisk annotering, ontologier osv. (Vad detta innebär för LDB ids jag inte ens tänka på nu ...). Hur som helst måste vi börja tackla de svåra problemen med tolkning maskinellt. För det är redan på gång. I Finland har vi också varit duktiga på semantisk webb. Nu skulle det gälla att slå ihop dessa kompetenser på allvar. Länkning blir särskilt viktigt för humanister, eftersom våra data finns kors och tvärs i olika system.





Ett exempel från Kanada. Liknande saker kan vi också göra om vi vill, 
och mer är förhoppningsvis på kommande. (Videon via @PekkaHenttonen)


måndag 13 april 2015

Mängder av internationella samarbeten

I dag ordnades ett seminarium på Vetenskapernas hus som handlade om den internationella utvecklingen inom öppen forskning. Seminariet bestod egentligen av fyra paneldiskussioner med olika teman: den europeiska utvecklingen, öppen forskningsdata, open access och internationella forskningsinfrastrukturer. Man kan lugnt säga att det pågår väldigt mycket på politisk och institutionell nivå, men forskarna är relativt svagt företrädda i processen. En av panelerna leddes av en forskare och just i den diskussionen blev det också tal om hur viktigt det skulle vara att engagera forskarna vid utvecklingen av tjänster och annars också. Det finns många strukturella saker att fixa, men i slutändan är det ändå forskarna som sitter med data och resultat och som gör själva forskningen. De är därför i en nyckelroll.

Några av de projekt eller organ som nämndes i dag var (alltså på riktigt bara en del ...):

  • LERU, nätverk för europeiska forskningsuniversitet
  • FOSTER, EU-projekt för utbildning i öppen forskning
  • RECODE, EU-projekt för samordning av öppen forskningsdata som kommit med färsk rekommendation
  • EU kommissionens forskning och dess enorma satsning HORIZON 2020
  • ERA-projektet för öppen forskning i Europa
  • EUDAT, europeisk infrastruktur för forskningsdata där Finland hållit sig väl framme
  • ESFRI och e-IRG, stora europeiska nätverk och organisationer för forskningsinfrastruktur
  • ICSU och  CODATA, internationella organisationer för forskningsdata
  • RDA stort växande forskarnätverk för frågor om forskningsdata
  • Liber, organ för europeiska forskningsbibliotek
  • OpenAire, europeisk tjänst för att söka öppen forskning
  • Pasteur4OA, EU-projekt för utveckling av open access
  • Haagdeklarationen, av Liber koordinerat projekt för open access
  • ROARMAP, register för open access-policyer i olika länder
  • Världsorganisationen UNESCO
Samtliga dessa jobbar på sätt eller annat för öppen vetenskap, så det är verkligen stora krafter i rörelse. Det borde ju bara vara att ta skeden i vacker hand för skeptiker, i synnerhet som inga av dessa aktörer är några orealistiska fanatiker, utan det handlar om att göra saker på ett vettigare sätt och kanske till och med att rädda vår planet. Ingen vill ställa orimliga krav på öppenhet, utan man värnar om etik och ekonomi. På "motståndarsidan" finns närmast rent kommersiella intressen (alltså sådana som gör pengar bara på att förmedla vetenskaplig information) och en drös med andra strukturer och verksamhetskulturer som härstammar från flera sekler tillbaka. 

Vetenskaplig kommunikation kräver mycket resurser av forskningen i dag (och proportionellt blir det allt dyrare, eftersom vissa megaförlag skor sig hänsynslöst på sina monopol), samtidigt som vi absolut skulle behöva investeringar för att hantera och utveckla infrastrukturer för att inte slösa resurser i onödan. Trots att det alltså behövs strukturella förändringar är det ändå så att också forskarna har lösningen i sina händer: man kan också driva förändringen utgående från "den lilla forskaren", genom att vara innovativ och bara idka öppenhet alltid där det går. För också forskaren utmanas hårt idag av den nya digitala miljön, helt direkt. Det gäller att slåss för sitt utrymme och ju mer man delar och publicerar, dess bättre chanser har man att klara sig.

Tweets finns också samlade på Storify.

fredag 10 april 2015

Tussilago, forskningsdata och bubblor

Våren börjar verkligen komma på allvar nu med tussilago i dikesrenarna. Efter en eländigt tung vinter känns det smått otroligt. Ingenting kommer förstås någonsin mer att bli som förr i mitt liv och lätt är det inte ännu. Sorg och saknad slår mig ibland plötsligt som knivar i bröstet och ibland får också små motgångar och svårigheter mig att inse hur bräcklig jag är, att mina resurser är ganska utarmade. Å andra sidan känner jag mycket glädje och tacksamhet för att det är så mycket som är så bra och som gått så bra. Och att veta att vår familj klarat av hårda stötar tillsammans känns skönt.

En del saker att glädjas över har jag också haft i mitt arbete den senaste tiden. Det har varit jätteroligt att undervisa igen. I går höll jag en i princip helt förnyad föreläsning och forskningsdata för humanister. Jag gick mycket ytligt igenom metoder och olika datatyper, mest fokuserade jag på själva datahanteringen: hur man kan skapa data, hur man kan strukturera den och vad kvalitet innebär. Det blir förstås också extremt ytligt på en enda föreläsning, men detta är ju saker man måste jobba med för att lära sig. Det allra viktigaste är att folk begriper att det är saker som kräver mycket eftertanke och planering. Jag tror jag nu hittat en ansats som funkar i alla fall och till nästa gång får studenterna göra en visualisering.

En annan sak som gått framåt är att handboken i öppen forskning som jag jobbat med av och till sedan hösten. Vi har nu gjort om den till en webbsida, som vi publicerar under våren. Tanken är att tröskeln att kommentera ska vara så låg som möjligt, för vi behöver verkligen kunskap och engagemang från hela fältet. Det hela är förstås en marknadsföringskampanj för öppenheten i sig också. Jag tycker dessutom att det är super att vi kunnat ta i bruk ett litet finskt företags diskussionsplattform. Den är störttuff. Kolla in den, där bubblar redan ... !