lördag 10 november 2018

Det finns inte falska nyheter längre



Målmedveten användning av begreppet Fake News har uppnått sitt syfte. Det har gått fullständig inflation i ordet och vi står maktlösa inför det mest genomskinliga och flagranta förfalskandet av nyhetsmaterial.  Den populistiska ytterhögern har, samtidigt som den beskyller både forskning och traditionell kritisk faktabaserad journalistik för nihilism, relativism och postmodernism, själv frigjort sig från sanningskravet. Man har skapat en narrativ där fakta är underordnade en svartvit berättelse. Det hela är som en extrem version av manipulativ projektion, som blivit en reell del av politiken åtminstone i USA.

Som den värsta propagandaapparat har man tömt ord på betydelse. När uppriktiga medier i åratal blivit beskyllda för att vara "falska", har det lite effekt när dessa ropar tillbaka beskyllningar om förfalskade nyheter. Trots det, uppstår hela tiden nya projekt för att peka på falsifiering av verkliga händelser.  Begreppet falska nyheter, med förkärlek använt av samma aktörer som gör åsiktsjournalistik, är tömt på sin betydelse, sin effekt. Det betyder ingenting längre.

Man bör alltså närma sig problemet mer specifikt och ta i bruk nya begrepp. Forskare vill nyansera diskussionen och hellre tala om "information disorder". Det är vettigt med tanke på att det inte alltid handlar om fabricerade nyheter. Det kan lika väl vara frågan om förvrängning, selektiv rapportering eller bara att man tar bort relevant kontext. Jag funderar på vad det kunde kallas på svenska. Oordning låter lite vekt. Vad som gör mig mest upprörd är uppsåtligheten och den narcissistiska egoismen i det hela.

Informationskaos kanske?

måndag 5 november 2018

#passemma - långsiktigt digitalt bevarande 3 år!

Frågade halvt på skämt deltagarna om man borde bevara så mycket som möjligt (grön)
ett urval i begripligt format (gul) eller bittar, AI fixar resten (blå).


I dag samlades över hundra personer på CSC för att diskutera långsiktigt bevarande. Vi hade gäster från både Nederländerna och Tyskland och kontentan blev nog att det överallt behövs lika stora nätverk och lika mycket samarbete för att få saker att rulla på allvar.

De finska tjänsterna håller hög nivå, det behöver man inte sticka under stol med. Poängen är att då man faktiskt på allvar ger sin in på att bevara digitalt räcker det inte att ha massor med backup-kopior, utan bevaringen handlar om att också hålla reda på den logiska nivån (t ex administrativa aspekter) och den semantiska nivån (det vill säga att man faktiskt ser till att informationen är begriplig också om hundra år). Ni förstår att det handlar om rätt annorlunda saker än att ha några extra kopior. När filformat, mjuk- och hårdvara föråldrats för länge sedan och man fortfarande vill kunna hitta och utnyttja gamla webbsidor, video osv. behövs mycket planering och information, metadata. Och det är verkligen så att det behövs både brett och djupgående samarbete mellan sakkunniga på olika håll och inom olika områden. Vilket också var dagens tema. Samarbete.

Samtidigt känns det som vi bara är i början av en lång väg. Vi har kommit långt, men fortfarande uppstår hela tiden nya frågor som måste lösas och som måste lösas tillsammans. Arbetet kräver mycket resurser också på arkiv, bibliotek och museer, som redan är sakkunniga och har lagstadgade uppdrag inom informationsförvaltning och bevarande. Att det kommer att kräva ännu mera arbete inom forskningssektorn blir allt mer uppenbart. Forskningsdata är mer varierande och administration och existerande system mindre täckande. Men det är viktigt att vi inte ger upp, utan jobbar på, steg för steg. Det enda sättet att gå tillväga är att göra som vi redan börjat göra: att lösa ett problem åt gången. Jobbet tar nämligen aldrig slut.



söndag 4 november 2018

När allt går fel med AI



I går kväll stod storasystrarna vid Stellas grav och tände ytterligare några ljus och försökte pula in dem bland alla blommor. Saknad, älskad är hon. Jag konstaterade att jag mest sörjer att hon inte kan vara med och ta del av vad allt våra barn gör, men vi konstaterade också enhälligt att vi alla är glada att hon inte behövde uppleva den senaste tidens politiska utveckling. Hennes hjärta hade brustit av raseri och sorg. Hon, som använde sina sista krafter för att bekämpa främlingsfientlighet.

I dagens Hesari fanns ett hårresande exempel på hur man kan missbruka teknologi, när det varken finns intresse eller vilja att försöka förstå vad det handlar om. De mest elementära insikter, dvs ungefär min nivå, inom artificiell intelligens, gör att man inser att det inte går att göra någon sorts lögndetektor för asylsökande med hjälp av ansiktsigenkänning. Som en av experterna i artikeln kommenterar, skulle det förutsätta att man har ett omfattande verifierat jämförbart datamaterial som grund. Var och hur tänkte man få tag i det? Det är verkligen en mycket farlig chimär att tro att datorprogram kan erbjuda absoluta sanningar, när det från början till slut handlar om sannolikheter. Det går helt enkelt inte att frånsäga sig ett moraliskt ansvar med hjälp av data och mjukvara. Även om det handlar om "intelligenta" redskap är det ändå alltid bara verktyg som används av människor, som bär ansvaret.

Finlands regering har i sin informationspolitiska utredning lyft fram både artificiell intelligens och etik. Men etiken handlar här mest om öppenhet och människors möjligheter att kontrollera uppgifter om dem själva, men man noterar även vikten av till exempel underliggande datas kvalitet.
"Frågor gällande riktlinjer i anslutning till artificiell intelligens handlar om algoritmers öppenhet, etisk och laglig grund, uppgifter som artificiell intelligens använder och deras transparens, rättigheter, ansvar och makt samt förhållandet mellan människa och maskin. [...] Vid upplärning av artificiell intelligens krävs etiska standarder för att stärka individens datasekretess samt säkerställande av datakvalitet och tillförlitlighet."
Det är motiverat att grunder i programmering ingår i grundskolans undervisning. På samma sätt som medborgarna måste kunna genomskåda reklam om skönhetskrämer som "innehåller DNA", bör vi kunna se när användning av algoritmer är berättigat och rimligt.

Det faktum att Europeiska kommissionen finansierar forskning inom artificell intelligens och söker lösningar för effektiv administration också vid gränserna är givetvis ok, men att man smyger in ytterst opålitliga och därmed oetiska hjälpmedel är en sak som verkligen borde väcka ramaskri i Europa. Det är också värt att studera vilka som står bakom dylika projekt. Det är sannerligen inte mitt Europa.



fredag 2 november 2018

Röda, gröna och blå data



Bilden här ovanför har jag vänt och vridit på av och till i ett antal månader och idag fick jag äntligen presentera den offentligt på Informaatiotutkimuksen päivät i Åbo. Tillsammans med ett antal kolleger har vi grubblat över hur vi ska få ordning på olika typer av forskningsdata och tjänster de hänger ihop med. Just nu råder nämligen något av en djungel där man del försöker bygga system för data som snabbt ackulmueras i stora mängder i samma andetag som man vill se till att forskare kan få merit och forskningen bli möjlig att validera genom publicering av små disparata och mycket varierande dataset som ligger som grund för enskilda undersökningar. Det vill inte riktigt lyckas helt enkelt.

Vi kom till att det finns massor av metadataformat och begreppsmodeller och dylikt, men det saknas en gemensam, allmän kategorisering som är överskådlig och stöder hantering av data i praktiken. Så vi gick igenom möjliga sätt att kategorisera data. De olika aspekterna går grovt taget ut på att dela upp data enligt i tekniska, kontextuella och inneboende dimensioner. De två första har vi system för att uttrycka maskinläsbart eller ens delvis strukturerat, men bland de sista finns i synnerhet en dimension som påverkar användningen mycket och som inte är standardiserad i generiska system och tjänster. Det handlar just om datas stabilitet. Det finns aktiva data, generiska forskningsdata och specifika datapublikationer. 

Jag tror fast på att en dylik tredelning hjälper oss vidare då det gäller att utveckla tjänster och system för dokumentation, citat, beständiga identifierare och planering av datahantering.  Så jag hoppas jag kan kavla upp ärmarna mycket snart.

Hela resonemanget presenteras i Informaatiotutkimus decembernummer.

måndag 29 oktober 2018

WIDE Open Source Science





I söndagens Husis intervjuar Patrik Harald digikritikern Pekka Vahvanen.  Jag har inte läst boken, men på basis av vad jag läst om den verkar det hela bygga på en ganska tunn kunskap om forskning och teknologi. Åtminstone ser det mest ut att handla om tyckande. Därmed inte sagt att det inte är viktigt med kritisk diskussion och pamfletter, men det skulle också vara viktigt med ordentlig analys och att skapa nyanserad och faktabaserad diskussion. Det är förstås möjligt att bilden i medierna inte alls ger en rättvis bild av bokens innehåll.

Jag har tillbringat hela veckoslutet med att fundera på liknande frågor. Eller snarast har jag lyssnat på en massa smarta människor som försökt hitta lösningar för hur man kunde tillgodogöra sig forskningens resultat och förbättra kunskapsbasen vid offentlig debatt och beslutsfattande. På Nationalbiblioteket i Brödfabriken ordnades ett hackathon för Open Science. Det ena spåret jobbade med kodning och artificiell intelligens och Nationalbibliotekets öppna data och det andra med koncept just för att åstadkomma bättre genomslag för och nyttjande av forskningen. Det var en strikt faciliterad process som pågick i flera dagar, och den resulterade i flera mycket intressanta koncept, som att ta ut forskare till allmänna bibliotek eller stöda tjänstemän att vaska fram sakkunniga med hjälp av artificiell intelligens för att i en transparent process ge utlåtanden vid beredning av ärenden. Eller faktagranskning för vetenskapsnyheter. Och koncepten var faktiskt genomarbetade. Segrare blev en bearbetning och utveckling av kunskapskristaller. Trots att idén alltså inte i sig är ny, har den mycket potential och en plan för att dra igång utvecklingen utarbetades under evenemanget.

Problemen med att det publiceras för mycket forskningsresultat, så att det avsiktligt eller oavsiktligt går att "underbygga" de flesta påståenden med enskilda forskningsresultat, och att vi dessutom har beslutsfattare som inte ens försöker bedriva annat än ideologiskt baserad politik, borde absolut tacklas med öppenhet och mer systematiskt kunskapsbygge. Vi måste helt enkelt bryta oss loss från de gamla strukturerna för vetenskaplig kommunikation. Motståndet är stort eftersom det handlar om verkligt stor business. Samtidigt blir det allt tydligare att prestigefyllda journaltitlar eller formell peer review inte garanterar kvalitet. Att övergå till open access-publicering kommer inte att räcka, så länge finansierings- och meriteringsmodellerna ser ut som de gör. Frågan är hur länge man från finansiärshåll tänker låta det hela fortgå. Vi väntar fortfarande på det krapulantiska uppvaknandet från new public management-struntet inom flera sektorer och däribland tyvärr forskningen.

De verkliga problemen har faktiskt relativt litet att göra med digitaliseringen i sig själv. Tvärtom erbjuder digitaliseringen lösningar, bara man förstår sig på att använda de växande datamängderna och den ökande kapaciteten på ett vettigt sätt. Så att man inte förstorar problemen, utan löser dem. Att sura och låta bli att använda it-teknologi är då verkligen ingen lösning.





onsdag 24 oktober 2018

Digitalhumanistmöte på Uni






Årets Heldig Summit ägde rum i går med ett tio timmar långt seminarium med ett hundratal deltagare. Döm om min glädje då artificiell intelligens nämndes en enda gång och resten av pratet handlade om substans. Väldigt tekniskt dock, men i alla fall. Det beror förstås på att det är tekniken och metoderna som förenar. Det humanistiska kunnande är inte alltid så starkt, men det är mötet och samarbetet som är cloun.

Och fältet växer fortfarande kan man lugnt konstatera. Dataarkivet visade till exempel upp imponerande tillväxt i användningen av deras material. Vad som kändes lite oroande var ändå att man väldigt lite tangerade frågor om hanteringen av forskningsdata eller hur man överhuvudtaget kan producera robust forskning med verifierbara resultat och beständiga hänvisningar till data eller metoder.

Keynoten av professor Charles van den Heuvel från Amsterdam nämnde ändå uppgörandet av en välförankrad data management plan som en av sina viktigaste lärdomar. Och den planen ska inte handla om data per se, utan om helheten. Annat klokt han sade var att man bör börja med planeringen av användargränssnitt och tillgängliggörande över webb (även kallat service design ...). Andra sammanhang där data management och hållbarhet nämndes var på tal om ontologitjänsterna och resurserna av länkad data.




måndag 22 oktober 2018

Chefer och ledarskap



Läste med stor behållning ut Staffan Bruuns bok om sin karriär på Hbl. En fin nostalgitripp till 80- och 90-talen på alla sätt. Det som jag allra mest funderat på efteråt är ändå hur fantastiskt han skildrar glidningen då arbetet från att ha varit helt resultat- och substansorienterat i och med digitaliseringen plötsligt blev något som behövde styras, planeras och organiseras på de mest brutala och våldsamma sätt. Typiskt nog anses ofta det enligt denna i vissa kretsar omfattade, men totalt galna lära, också att chefer inte behöver ha substanskunnande, tvärtom är det kanske snarast bättre om de fördomsfritt kan rasera gamla invanda rutiner och tankesätt och slå sönder så mycket som möjligt av den existerande kulturen. Det ligger något av chockdoktrin över det hela.

Fenomenet med den svällande kasten chefer med en ny organisatorisk, hierarkisk och ekonomisk tyngd beskrivs fint av Bruun. Det är som skolexempel på Parkinsons lag och på hur fokus snabbt kan flyttas från substans till organisationsstrukturer och maktspel.  Det som för mig ter sig allra mest ironiskt är ju att det digitala i grunden borde öppna för effektivt arbete, responsiva organisationer och reflexivt ledarskap. Men en så stor omvälvning som digitalisering är svår, om inte omöjlig, att behärska då allt är i gungning.

Det är lätt hänt att det blir svårt att fokusera på rätt saker och att se skogen för träden när stora förändringar är på gång. Men det värsta man kan göra, tror jag, är att då inte låta saker flyta en aning och låta dem som jobbar med substansen arbeta extra fritt med att fundera på mervärde och kvalitet. Hur som helst är det just i sådana dynamiska skeden de sakkunniga borde leda sig själva i jakten på nya lösningar. Att chefer kanske just i en sådan mycket komplex situation måste vara extra ödmjuka och lyhörda känns ganska självklart. Därmed inte sagt att man inte ska hjälpa med att hitta nya lösningar och riktningar. Men kreativitet kan inte pressas fram. Jag minns den tunga stämningen då man försökte och jag var med en gång. Det fanns inte glädje eller hopp, bara misstro och tvivlan, fast alla försökte vara konstruktiva. Jag beundrade redan då dessa kunniga och duktiga människor på Husis, som verkligen gjorde vad de kunde under mycket jobbiga omständigheter.