lördag 18 februari 2017

Personregister

Just nu är personregister och integritetsfrågor på tapeten av flera olika skäl. I västliga Europa har vi av tradition (sedan andra världskriget) varit mycket försiktiga med personregister. Vi har sett vad de kan leda till. Vi har också en stor förändring på gång inom EU, där ett nytt direktiv kommer att träda i kraft, för att förenhetliga kutymen i olika länder och trygga medborgarnas rättigheter.

I USA har man varit mer storsint, vilket gett utrymme för tillväxt och utveckling, men i dagens politiska situation kan kännas ganska obehagligt inte minst efter Snowdens avslöjanden. Frågan om integritet och kontroll över uppgifter som gäller en själv har alltså blivit allt mer aktuella också i USA. Samtidigt har maskininlärning och stordata gjort att man inte ens behöver veta särskilt mycket om en person för att kunna av-anonymisera folk ur stora dataset. Och att profilering av människor används inte bara för forskning eller marknadsföring av varor och tjänster utan också på mer skumma sätt.

Det nya EU-direktivet innebär att människor ska ha rätt till alla uppgifter om dem själva. Också Tim Berners-Lee har nu tagit upp saken. Hans tankar följer ganska nära MyData-filosofin, som i Finland varit av betydelse redan en tid. I sommar ordnas den andra MyData-konferensen i Helsingfors, denna gång tillsammans med aktivister i Tallinn. Tanken är att erbjuda plattformar och verktyg för att hantera data om en själv.

En bra sak med det nya direktivet är att det öppnar för möjligheter för forskare som i Finland i dag ibland har problem med de hårda kraven på explicita tillstånd för varenda åtgärd, dvs varje forskningsfråga man vill ställa ett dataset som innehåller uppgifter om människor. Att tänka sig att begära individuellt lov var varje person, även i fall då man behandlar materialet konfidentiellt och enligt strikta forskningsetiska principer och aldrig har för avsikt att profilera enskilda individer eller publicera någon information av det slaget, är enligt mig ett orimligt krav. En sådan tolkning är nämligen möjlig men den är problematisk, i synnerhet då man hos oss har en väldigt vid syn på vad som är en personuppgift. Lagtexten har inte riktigt hängt med här, då det gäller forskning och stordata, den är otydlig. Akademiska forskare följer ändå etiska principer och arbetar för andra mål än att främja en viss politiker eller sälja någon produkt. Dessutom hör det till sakens natur att forskningsfrågorna lever under processens gång. Det är liksom idén och just det fina med att jobba med digitala metoder, att vi kan få syn på helt överraskande saker, fenomen vi aldrig ens kommit oss för att fråga efter. För att de nya möjligheterna ska förverkligas behövs ändå en nationell lagstiftning som är vettig både med tanke på integritetsskydd och forskning för det allmänna bästa. I slutändan måste vi arbeta utgående från etisk reglering även då det gäller annat än traditionell registerforskning, allt annat är orealistiskt.

Redan i dag är det som sagt klart uttryckt i lagen att då man samlar in personuppgifter måste man ha ett klart syfte, man får inte samla eller hantera onödiga uppgifter om personer. Vilket får mig att undra varför så många samlar in uppgift om kön i varje vända. Är det relevant för ett bibliotek eller ett förlag till exempel? Och i vilken mån är detta en helt onödig kutym som gör att könsstrukturer reproduceras igen och igen då de används som parametrar i profilering och vidare vid utveckling av produkter och kommunikation? Vilken är evidensen för att det faktiskt är relevant information, och kan vi komma ifrån att det i grunden är en ideologisk fråga?

I varje fall tröstar jag mig med att en profileringstjänst utgående från ett kort textstycke ännu tillsvidare profilerade både min ålder och mitt kön åt skogen.

Omständigheter

En av mina favoritböcker är Malcom Gladwells The Tipping Point. Den illustrerar på ett otroligt bra sätt hur mycket vi alla är fångar av omständigheter, av givna strukturer, av en existerande kultur, av hela det system vi föds in i, växer upp i och lever i. Även om det finns en fri vilja, är den så mycket mindre än vi oftast kan och vill medge. Vi är fångna i oändligt många val som gjorts före oss, i begrepp och tankestrukturer som begränsar vad vi kan göra eller ens tala om. Ofta inser vi inte ens att vi väljer, att vi har ett val.

Och även om vi i princip har ett val är vi många gånger så mycket mer maktlösa är vi skulle vilja vara. Jag tänker att det är ett undantag att man medvetet gör ett val eller att en ensam individ kan påverka mycket genom sina val och sitt aktörskap, åstadkomma verklig förändring. Det handlar om ord och begrepp, men också om system, sega strukturer, sådana vi ofta också kan och borde vara glada över. Som till exempel i dag, då vi ser på världspolitiken där ett unket, fascistiskt, nationalistiskt slem sprider sig över vår kultur. Det finns spärrar, men vilka är de osynliga svackorna och strukturella gliporna, som ger möjlighet för populism och rasism att sprida sig? Hur kan vi i snabb takt tillsammans stärka barriärerna och forma kulturen och samhället och hindra en störtdykning i en vettlös ond spiral? Hur kan vi tala om det goda, stärka mångfald och rikedom? Hur kan vi överrösta det idiotiska, tendentiösa skrikandet om kris, hot och katastrof, då vi i verkligheten har det bättre än någonsin, men samtidigt borde åtgärda verkliga globala, ekologiska hot? Sanningen är troligen, att förändringarna är långsamma och har pågått i decennier.

Sambandet mellan de personliga valen, vardagen och de djupa strukturerna diskuterades också i Hbl för några veckor sedan av filosoferna Nora Hämäläinen och Thomas Wallgren. Frågorna är svåra och mångbottnade. Själv tycker jag det är klart att det behövs aktörer, idealister, aktivister, som formulerar saker, pekar på problem och utmaningar. Men det behövs också att folk stöder dem, tar upp deras idéer, förvandlar dem till handlingar, må det sedan vara använda ett "hen" eller att ändra sina konsumtionsvanor.

Vi måste också kämpa mot enfalden, enkelspårigheten, utarmningen i vårt språk och hur vi talar om världen. Saker är oftast så mycket mera komplexa än de ser ut. Det är lätt att döma andra, men det är sällan de som dömer faktiskt känner till och förstår bakgrunden, helheten. Vad människor vet och inte vet, vad man förstår och inte förstår, borde alltid vara föremål för uppmärksamhet. Det är viktigt att fråga varför. Men det är också viktigt att ha ett öppet sinne, att försöka förstå. Det var därför jag själv i tiden valde att studera just historia. Och varför jag sedermera vandrade vidare till det där med information. Hurdan informationen är, om den ens finns tillgänglig, och hur den används är ofta kritiskt. Hur väl folk tar den till sig är också avgörande, men ännu svårare.

Kunskap är information som finns i huvudet på folk, men bildning och visdom innebär att man dessutom ständigt är öppen för nya perspektiv, och att man kan inse sina egna begränsningar. Jag tampas mycket med dessa frågor just nu i och med att jag har många nya åtaganden. Det jag sysslar med känns för ofta som dillande, svamlande, klåpande, en kamp mot tvivel, tvekan och osäkert. Ångesten kommer krypande emellanåt. Information som saknas, misstag, missförstånd ... Ibland är jag så bombsäker på hur saker ska göras, ibland så förvirrad att det måste vara odrägligt för dem som är beroende av mig. Jag tröstar mig med att jag försöker mitt bästa och förhoppningsvis kan utvecklas. Och jag bryr mig faktiskt, om människorna, om målsättningarna. Och skattar mig lycklig att få vara med på ett hörn.

Historien, vardagen och kulturhistorien kommer väldigt nära på Esbo stadsmuseum just nu, där man kan bekanta sig med Köklax glasbruk. Det ger perspektiv, på många sätt. Rekommenderas.torsdag 9 februari 2017

On Digital History

* Denna text är baserad på mina anteckningar för det kommentarstal jag höll på Gösta Mickwitz seminariet den 9.2.2017* History is always written in its own time. In our time, when we write history and expand our knowledge of our past, when we build knowledge, we are also shaping our own time, our culture and society. And as we formulate truths about ourselves and our history, we also shape our future. We create the concepts and dependencies that are the building blocks of our future. The truth in history is also the truth of today and creates a scaffold for us to we shape our future. Questions of guilt and identity are never far away. Who we are, and who we can be. Questions of meaning, questions of human understanding. Those are important questions. Burning issues. Technology does not solve anything on its own. We need the humans, people to act as agents. In a time of digital media, statements, information and definitions are fluid, an ever changing play of meaning, representations and interpretation. The way we see ourselves and our society is complex and interconnected. People understand and structure these through stories, through narration. That is how we can explain complex phenomena and grasp them. But complictaed stories and truths also become extensive. They are long, slow. They take their time to be written, to be told and taken in. History is slow. It takes time to research, analyse, understand and explain. This is a serioius challenge in our time: not only to catch the attention of people, but to keep it. At the same time we have so much of the answers to offer, so many explanations and intellectual tools to deliver. Digital science and research can be Open science. It can share and engage, transform and live on. Today we have heard four fantastic presentations about the essence of digital culture. Let's reflect on them and let them inspire us. Here are some of my own reflections. Timo Honkela: Turning quantity into quality and making concept visible using computational means? Artificial intelligence can help us with meaning and complexity. We are just in the beginning of creating ways to represent meaning in an digital enviroment. Neural networks can help us understand and model concepts, these are questions Timo has worked with for many years and he gave a presentation about the split between word and concept, sign and meaning. He talked about how meaning can emerge in learning processes. My reflection was how the historian in his or her long narrations gives the words more solid meaning. More solid than any N-gram. Timo is hopefu thatl machines can help us understand each other better. Algorithms could point out differences in our understanding. What I came to think about was how the choice of source data will effect the outcome. Twitter of millions of people produce text different kind of text than one of a specific author, but it can tell us something about a certain culture, however we choose to define it. But the algorithms can also help us to find the cultures. Timo also came to mention the power dimension. Who owns the data and who defines the questions we ask. He also talked about the co-evolution of computers and human culture. The one does not exist without the other. Henrik Summanen: Digital potential i historiskt material Henrik, too, demostrated, how we are only in the beginning of digitization. We are still mimicing old media, often unable to see the difference between the stable and the fluid, streaming data and information. We still build silos and treat document as if they were disconnected entities. Henrik talked about linked open data. The fact is, that all data information is structured, and we could be a lot smarter in the ways we do it. That would help us find relevant questions and maybe even some answers. My thoughts were on how difficult it is to express uncertainty and missing data. Henrik also discussed the difficulties we have with sustainability and versioning. This, I'm sorry to say, is sadly very true especially in the GLAM sector. Hannu Salmi: Virality and Culture: Towards the Study of Digital History Virality is not a new phenomenon per se, as Hannu showed with wonderful examples from the 19th century. He talked in the most delightful way about digital methods and sources. He demonstrated how data and tools affect our research. One immediately hade many ideas: what if we could combine the different ideas and methods presented today? I was particularly happy to hear that he is drawing from bioinformatics in his research. The problems are many times the same when handling data. What is it we are researching, when studying old newspapers of a nation if not the DNA of its very culture! Hannu also used visualisation, which for historians is a new tool, when we use its dynamic and interactive features. How could we take advantage of them to create our on viral information? I loved Hannus conclusion, that boundaries and differences between past, present and future are overrated! Samir Bhowmik: The Materiality of Digital Heritage Samir gave an amazing talk. I was very happy to get this perspective included. The idea of digitisation of only information being "virtual" is a children’s disease of the early digital age. Materiality is important, since technology defines the culture. It is exactly the coevolution Timo talked about. The physical aspects and ramifications of our new media culture should not be forgotten or disregarded. They should be actively incorporated in our work. This is difficult, but important. Jussi Parikka is really a researcher that should be much more broadly studied among humanists. I liked Samirs ethical approach. The tension between sharing and openness on the one hand and the challenges of propriety technologies and technical skills as a commodity on the other, is something we should be very aware of. The opaque media is outside of our control. Samir talked much about black boxing in different ways. It is a crucial point, because it is a question of power. The black box is incomprehensible and out of our reach, outside our understanding and influence. Samir also talked about the challenges of capturing culture, without killing it, freezing it. The questions about the rupture between the cultural heritage conservation and the very dynamic essence of culture becomes distinctively clear in the digital environment. All in all the seminar was inspiring and I'm so excited about everything we heard today. As historians we are making our past digital but we also need to address the questions of preservation and sustainability. The digital world is not primarily one of technology, it is in the realm humanity. Never have historians been more important than today.

söndag 5 februari 2017

Ansvar och samarbete

Men mounted on an elephant from BL Harley 3244, f. 39 - Peraldus. The British Library. Public Domain.
Det talas en hel del om agil systemutveckling, och eftersom det visat sig vara ett rätt framgångsrikt koncept att hantera komplexa helheter och utvecklingsprojekt har idén blivit ett modeord inom många branscher. På finska talar man om att vara ketterä. I praktiken handlar det om att arbeta iterativt istället för att göra upp minutiösa planer i lägen då det finns många osäkerhetsfaktorer och risker. Man sönderdelar stora projekt i mindre delar och fokuserar på ett steg åt gången, löser problemen an efter att de kommer fram och är färdig att revidera planerna.

Det ligger mycket i att det inte lönar sig att öda resurser på att planera detaljer man omöjligt kan känna till i situationer längre in i framtiden, då saker är mycket avhängiga av val och beslut man är tvungen att ta under arbetets gång. En agil ansats kan vara både lockande och vettig, då det gäller stora reformer. Till konceptet hör många av de modebegrepp till och med vår regering slänger ur sig, så som vikten av försök och misstag. Det som man däremot tyvärr ofta missar är att det till exempel inom scrum-metoden handlar om en mycket rigid metod, ett helt system som innebär mycket noggrann uppföljning och kvalitetskontroll. Informationsgång, samarbete och roller är noggrant definierade för att det hela ska fungera. Det handlar också om att minimera risker. Man tar faktiskt en bit åt gången, följer framstegen noga och gör ständig utvärdering. Man kan till exempel inte i en smäll göra massiva, tidigare oprövade organisatoriska förändringar. Riskerna är alldeles för stora.

Det som särskilt fascinerar mig i scrum-metoden (som jag själv alltså numera både är utbildad i och arbetar med) är hur man hanterar ledarskap och teamarbete. Det är nämligen genuint teamarbete, vilket betyder, att det inte finns en person som är ansvarig för allt. Detta är en ansats som enligt mig passar i dagen samhälle som bygger på att man behöver mycket djup sakkunskap och stor specialisering, samtidigt som man måste kunna arbeta tillsammans på ett integrerat sätt. På samma sätt som inom problembaserat lärande, arbetar ett scrumteam på ett sätt, där alla tar och bär ansvar i samförstånd. Det finns också olika identifierade roller som främst handlar om att underlätta arbetet, vad man kunde kalla faciliterande uppgifter. Vissa personer är utsedda att ansvara för vissa typer av kommunikation och uppföljning, men poängen är inte att bestämma över de andra, utan att skapa förutsättningar för framgångsrikt arbete och en smidig informationsgång.  Själv tänker jag att vi generellt har en del att revidera i vår kultur vad gäller just hur man organiserar ansvar och arbete på många håll.


Och elefanten på bilden ovan? Det är ett av det mest slitna uttrycken i branschen, att man "äter en elefant en bit i taget". Det handlar just om att sönderdela utmaningar och stora uppdrag och problem i delar och processer man kan hantera, en åt gången. Men det kräver analys och systematik, man måste se sambanden och målsättningarna. Med andra ord betyder det ingalunda att man kan sluta planera eller administrera arbetet. Tvärtom betyder det intensivt och öppet samarbete hela vägen med både "beställare" och "förverkligare".

onsdag 1 februari 2017

Rättvisa data

I dag kallade Vetenskapliga samfundens delegation till seminarium om tidskrifter, vetenskapligt förläggande och forskningsdata. Jag hann tyvärr med först till eftermiddagen och missade tydligen en hel del intressanta presentationer. Många av de inhemska tidskrifterna fungerar med väldigt små resurser, men känner ändå av tidens nya krav på att ta ställning till frågor om öppen forskning och öppna data. Många forskare vaknar sakta till det faktum att deras finansiärer och arbetsgivare börjar ställa alla möjliga krav på öppen tillgång. Här har tidskrifterna en nyckelroll i hur de bemöter forskarnas nya behov och ger direktiv om hur man gör t ex källhänvisningar. Själva tidskrifternas möjligheter att gå open access behandlades inte särskilt vid detta seminarium, utan det handlade alltså främst om data.

Trio of musicians from BL Harley 4375, f. 151v. British Library.

Vi diskuterade möjligheterna för tidskrifterna att stöda forskarna i deras strävan att öppna data. Viktigt är att man ger tydliga direktiv om att använda beständiga identifierare t ex DOI eller URN. Dessutom är det ju önskvärt att forskarna använder etablerade och professionella tjänster då det gäller att dokumentera, publicera och bevara data. Inom t ex samhällsvetenskaper och humaniora har vi utmärkta tjänster som Språkbanken och Dataarkivet, men alla har det inte lika väl ställt. Då är faktiskt en möjlighet att använda bevaringstjänsten IDA och katalogen Etsin. Då säkrar man att data finns tillgängligt och går att hänvisa till och även får synlighet. Så egentligen kräver det inte så mycket av redaktörerna att hänvisa till dessa tjänster. Att skapa bra metadata får forskare förhoppningsvis hjälp med av sina egna forskningsbibliotek. Det kräver ofta att man planerat och dokumenterat datahanteringen från början, men har man det borde det hela gå rätt smidigt.

En intressant möjlighet skulle också vara om tidskrifterna kunde grunda egna samlingar för forskningsdata i samband med de nationella tjänsterna. Då skulle substanskunniga specialister ha god överblick över hurdan data som finns och det kunde vara av stort värde då det gäller att utveckla olika format och best practice och på andra sätt arbeta för att ytterligare förhöja kvaliteten på data och även ta ställning till frågor om långsiktigt bevarande och rekommenderade format.

Kort sagt är detta med data inget tidskrifterna är ensamma med och inte något man behöver oroa sig för. Bra vore, om man kunde enas om allmänna råd om hur man behandlar data i samband med publiceringen, men själva arkiveringen och publicerandet finns det också andra som kan hjälpa med. Det gäller bara att ta tjuren vid hornen. Det är ändå forskarna som är de största experterna och som bär huvudansvaret för hela forskningsprocessen och sina material. Samtidigt kan det bara höja både tidskriftens och forskningens kvalitet om man från redaktörshåll också åtar sig att fråga efter forskningsdata i samband med granskning och publicering. Dessutom, hörde jag i dag, bidrar också öppna data till att själva artiklarna får mera synlighet. Inte bara lite, utan tydligt.

Ja, och rättvisa data, det handlar om de nya europeiska FAIR-rekommendationerna för forskningsdata. Det låter kanske svårt, men faktum är, att det mesta av infrastrukturerna redan finns i Finland. Det gäller bara att använda dem.