Essetter: februari 2014

fredag 28 februari 2014

Wikimaps

I dag hade vi ett fint internationellt möte om gamla kartor och att förse dem med sådan metadata att de kan läggas på moderna kartor, vilket skulle öppna för mycket fina sökmöjligheter och andra intressanta tjänster. I dagens läge är till exempel Riksarkivets digitaliserade kartor rätt hopplösa att söka bland. Lyckligtvis är Riksarkivet med i detta projekt, som sparkats igång av Susanna Ånäs och nu har sitt hem hos Wikimedia. Det fanns alltså deltagare från Finland, Sverige, Norge, Danmark, Estland, Storbritannien och Nederländerna. Helsingfors stad var med och berättade vad de jobbar med, och vi fick också bekanta oss med ett open source-verktyg, som man kan använda för att anpassa gamla kartor till moderna kartbotten.

Det vore förstås spännande att till exempel kunna söka gamla kartor från olika källor bara genom att välja ett geografiskt område på en modern karta. Sådant torde vara rätt enkelt att göra, men det behövs talkoarbete för att skapa den metadata som behövs för de gamla kartorna, som förstås har olika och i bland helt felaktiga proportioner. Men det finns också annan information som är kopplad till platser. Själv skulle jag vilja säga att det finns tre slags information:

Koordinater. Dessa kan antingen vara punkter eller områden (polygoner)
Ortnamn och adresser. Begrepp som hör ihop med platser, kan ha många varianter
Tidsperspektiv. Viktigr alltid, men inte minst i detta fall: tidpunkter, före, efter, mellan ...

Alla dessa är sökkriterier som borde fungera bra, för att en tjänst med gamla kartor ska vara användarvänlig. Dessutom vill man ju gärna ha en möjlighet att lägga till information eller länkar till relaterade material, så som gamla fina fotografier som äntligen allt mera börjar dyka upp på webben.

Signe Brander (1907), Helsingfors stadsmuseum via Finna.fi

torsdag 27 februari 2014

Väntan

Sitter och vaktar på Riksdagens webbsidor på att minister Kiurus svar på spörsmålet om Brages Pressarkiv ska komma. Det är försenat, och jag har diskuterat med ett par tjänstemän vid Riksdagen om processen. Måste säga att dessa personer var mycket sakkunniga och tillmötesgående. Verkligen trevligt, de gav sig tid att förklara mer än jag frågade efter. Stort plus för dem.

Ett lite mindre plus vill jag ge till webbstjänsten, som saknar någon form av flöde, så att man kunde följa ärende t ex per e-post eller något annat. Dessutom funkar inte länken man kopierar från webbläsaren direkt. Jag fick en fungerande URL per e-post. Verkar lite krångligt. Förnyandet av systemet är på gång, men har nog inte framskridit enligt planerna. Så nu sitter jag här med webbläsarens auto-refresh-plugin ...

tisdag 25 februari 2014

Drömmar om öppenhet

I morse ordnades ett frukostmöte på Café Aschan av Europeana med samarbetsparter. Det är en tid sedan jag haft tid och möjlighet att vara med i dessa kretsar och det var många glada återseenden åtminstone för min del. Tillställningen inleddes med en presentation av Europeana, som verkligen vuxit och mognat till ett oerhört intressant projekt. Bland annat puffades de nya drömmarna och det fina crowdsourcing- och materialinsamlingsprojektet om första världskriget. Man jobbar på ett fint sätt med delaktighet och öppen länkad data. Det handlar om att se informationsresurser som just resurser och utnyttja dem så effektivt som möjligt. Man kunde lära av denna ansats på många håll inom vårt samhälle.

Efter inledningen ordnades en diskussion om digitalkultur. Det kom flera kommentarer om att alla fyra deltagare var kvinnor, vilket förstås var en trevlig slump. Diskussionen var mycket intressant, men jag var tyvärr tvungen att springa därifrån innan den tog slut. Under diskussionen kom i alla fall flera viktiga aspekter fram, som jag också grunnat på, inte minst behovet av ordentliga informationsstrukturer för att ny kunskap verkligen ska kunna uppstå.

Minna Karvonen från Kultur-och undervisningsministeriet tog också upp en annan sak jag varit inne på, nämligen problemet med lärare som är osäkra på teknik och elever som tror att de behärskar allt som har med det digitala att göra, även innehållsmässigt. Minna lyckades formulera det mycket bättre än jag någonsin kunnat: lärarna kan kritisk läsning och substans, men de känner ofta mycket stor osäkerhet inför de tekniskt självtillräckliga eleverna, vilket förhindrar eller försvårar överföringen av den viktiga kompetensen kritisk läsning, mm. Hon kallade detta för osäkerhetsglapp (epävarmuuskuilu, tror jag det finska ordet var). Om vi inte tar i denna problematik i rask takt och ordentligt, kan vi få en del negativa följder senare.

Rykten gick också om att nationell dataaggregering kanske lite tonats ned inom Europeana. Jag tror det kan vara rätt tänkt, eftersom det kan påverka datans kvalitet negativt. Dessutom är det mycket viktigt att alla minnesorganisationer faktiskt förstår att de själva bär ett ansvar för att också öppna sin egen data direkt. När man en gång vågat öppna (för det handlar om att våga, det framkom i dag igen) via Europeana, ska man inte stanna där, utan också öppna sin okorrumperade data för världen direkt.

söndag 23 februari 2014

Vad fonderna måste

För någon tid sedan blev jag uppringd av en journalist som ville ha mig till ett tv-program för att diskutera Guggenheimmuseet med Kulturfondens direktör Leif Jakobsson. Jag svarade direkt nej. Det kanske kunde tolkas som feghet på grund av Brages Pressarkivs trängda situation, att jag inte skulle vilja stöta mig eller kritisera en penningstinn institution och potentiell finansiär. Men det var nog inte orsaken.

Orsaken var den, att jag helt enkelt har väldigt svårt att ha några bestämda synpunkter på vad de finlandssvenska fonderna och stiftelserna ska göra med sina pengar. Dessutom känner jag en stor osäkerhet och okunskap inför hela Guggenheimprojektet. Jag har absolut ingen aning om hur man "borde" gå till väga då man grundar ett konstmuseum eller ordnar en arkitekttävling. Jag har inte ens som privat medborgare en välformulerad åsikt om vi borde ha ett Guggenheimmuseum eller inte. Frågan känns alldeles för komplex och svår att ha en åsikt om, utan att verkligen ha satt sig in i alla aspekter. Helt klart rör det sig om stora pengar, vilket gör att man måste vara på sin vakt och jag har en vag känsla av att det skulle kännas bättre att understöda och lyfta fram inhemska aktörer. Men jag vet ingenting om saken. I det läget ville jag inte gå med i något debattprogram där man borde ha ett hum om vad man talar om.

Den andra sidan av saken, alltså vad Kulturfonden och andra dylika finlandssvenska aktörer borde göra med sina pengar, är kanske något man som medborgare i "den finlandssvenska republiken" förväntas ha en åsikt om. Men det är också något jag på senare år, då jag arbetat närmare dessa frågor, blivit allt mer försiktig med. Det är nämligen inte en finlandssvensk republik vi har, det är inte skattemedel som ska fördelas på demokratiska grunder, utan det handlar om privata medel som är donerade för specifika ändamål. Frågan om till vem olika organisationer är redovisningsskyldiga är därmed inte enkel. Jag är ganska säker på att ledningen i åtminstone alla de större finlandssvenska fonderna har ett genuint och uppriktigt intresse av att så gott det går uppfylla de syften som finns stadgade för dem.

Inom Kulturfonden använder man ett system med sakkunniga inom olika områden då man delar ut pengar. Det handlar om en process som lite liknar den akademiska kollegiala granskningen. Inom traditionell peer review för vetenskapliga tidskrifter är anonymiteten en viktig faktor. Det gör man för att motverka den s k Matteusprincipen om att den som har, ska få mera och den som har lite, ska bli av med det lilla han har. Det är ett fenomen som är väldigt tydligt inom t ex litterära priser (också internationellt): prisregnen faller skurvis över vissa författare, på ett sätt som ibland ter sig nästan löjligt. Att kretsarna är små kan man försöka motverka genom en viss grad av anonymitet. Å andra sidan blir det kanske mer rättvist om det inte är anonymt? Vem som ska vara anonym och när är ett ämne som tål att fundera på.

Frågan om anonymitet är också kopplad till frågan om transparens. Öppenheten är en norm som slår igenom allt kraftigare inom den offentliga sektorn på grund av den digitala utvecklingen och medvetna politiska beslut både inom EU och i Finland. Inom några år kommer total öppenhet att vara norm inom all offentlig förvaltning och allt beslutsfattande i Finland. Hur ter sig då i sådan miljö allmännyttiga organisationer som inte är maximalt öppna gällande allt sitt beslutsfattande? Detta är något man borde tänka ingående i genom redan nu, i lugn och ro: med vilka motiveringar kan man låta bli att öppna upp information? Sådana skäl kan finnas, men de bör motiveras väl.

Man kan igen se till det akademiska där alla ansökningar och utlåtanden är offentliga utom då det gäller den kollegiala förhandsgranskningen (som möjligen är på väg ut, eftersom de vetenskapliga förlagen får allt svårare att motivera sin business). Varje sakkunnig förväntas kunna försvara sina beslut och utvärderingar offentligt. Klarar Svenskfinland av en sådan transparens: att alla ansökningar och alla utlåtanden, alla protokoll finns öppet på webben? Vad kan man vinna och vad kan man förlora? Helsingfors stad är redan där: allt ligger enkelt sökbart på webben. Det som är viktigt att tänka på är att öppenheten också skyddar: den skyddar för ogrundade misstankar och beskyllningar.

Svenska Kulturfonden har uttalat sig för öppenhet och man har också varit väl framme med en visualisering för att hjälpa allmänheten att få en uppfattning om utdelningen. Frågan är nu kanske närmast om man vill gå vidare själv som en föregångare i öppenhet, eller vill man koordinera sig med andra aktörer (även finska) och skapa en gemensam linje för hur allmännyttiga organisationer hanterar transparens? Kanske har vi om några år en tydlig indelning mellan dem som uppfattas som öppna och förtroendeingivande, som därför levererar kvalitet, och dem som är hemlighetsfulla och slutna, kring vilkas egentliga utdelningsprinciper man fritt kan spekulera?

Hur som helst är jag själv inte färdig att ställa mig upp och säga hur "fonderna måste göra". Angående Brages Pressarkiv anser jag att det som hör till den offentliga sektorn - som viktig forskningsinfrastruktur som stöder hela landet - helt klart ska skötas just med statens pengar. Fast en synpunkt har jag på vad Kulturfonden borde göra med sina pengar: Kulturkarnevalen för skolungdomar hör till det finaste projekten jag sett, och jag hoppas verkligen att den får fortsätta och växa i framtiden. Den glädje, iver och skaparglädje jag uppfattat att finns där skulle jag unna varje ungdom i vårt land åtminstone en gång i livet.

lördag 22 februari 2014

Gloms

De senaste dagarna har det funnits en del insändare om den framskridande planeringsprocessen av det nya stormarknadsområdet Lommila i Esbo (ursäkta, jag orkade inte försöka leta rätt på eventuellt existerande svenska material i ärendet, p g a webbplatsens snårighet). En snabb titt i Presstanda visar att ärendet har en lång historia. Som återflyttare till denna trakt, där jag också har rötter sedan 1700-talet och vuxit upp under vilda västern-eran under 1970-talet, blir jag påmind om hur blinda nyinflyttade ofta är för kulturella och historiska miljöer. Därmed inte sagt att inte områden borde få växa och utvecklas och gällande det gamla Esbo har nog de största missarna gjorts på 1960- och 1970-talen, tror jag. Det gamla kulturlandskapet är redan till största delen redan totalförstört.

Jag ville gärna hitta lite illustration av hur området sett ut under tidigare sekler och decennier, men till min besvikelse hittade jag väldigt lite på webben. På Wikipedia finns en trevlig och välskriven artikel om Bemböle, men inga gamla bilder. Hur ska nyinflyttade esbobor ens i teorin ha en möjlighet att se kulturlandskapet och historien omkring dem, om det förväntas att man tar sig till arkiv eller museum under öppethållningstider? Jag vill be allmänheten om hjälp här: har ni gamla fotografier av gamla miljöer och landskap ladda gärna upp dem på Flickr eller Wikimedia Commons (det senare förutsätter att upphovsrätt inte gäller, dvs bilderna måste vara gamla, gärna äldre än 1966 om ni inte själva äger upphovsrätten, se närmare på finska här). Tagga bilderna med ortnamn!

Det gamla Bemböles fall har varit samma sak som dess styrka i historien: vägarna. Det ser man tydligt om man betraktar det bildmaterial jag enkelt lyckades vaska fram, kartorna. På den äldsta ser man förresten att det faktiskt på 1750-talet funnits två kyrkor i Esbo, en kvalificerad gissning är att det rör sig men en svensk och en finsk kyrka. Bemböle, som ligger intill Gloms, låg precis i en vägkorsning, där man från den sk Kungsvägen till Viborg kunde vika av mot vägen som genom nuvarande Alberga ledde ner till Helsingfors.

Detalj av karta från 1750 av Fredrik Johan Fonseen

Området var sannolikt en ganska livlig trakt med många resande redan på 1600-talet och Bemböle kaffestuga är ett historiskt spår av denna tradition, som kanske även annars oinsatta esbobor känner till. På en karta som torde vara gjord för storskiftet från 1765 (nedan) ser man tydligt att bebyggelsen är mycket tätare än i omgivningen. Notera att norr på denna karta är uppe till höger. Man ser också att området som nu ska byggas är gamla åkrar, de är ungefär det blåaktiga fälten mitt på bilden. Man ser ån ringla ner genom landskapet mot Kyrkträsk, så man inser att Bemböle även hade en vattenled.

En detalj från karta över ägorna i Bemböle med omnejd från 1765. Riksarkivet.

Och så har det fortsatt. I Finska recognoceringsverkets karta från 1790 finns Bemböle tydligt markerat, liksom i kartan som kan vara från 1930-talet. Det var glest mellan servicestationerna på den tiden, men i Bemböle fanns en.

Kustkarta Helsingfors-Porkala, s.a., Tilgmann.

I dag ser området ganska annorlunda ut, och korsas av stora tungt trafikerade vägar. Men söker man sig en liten aning utanför trafiklederna hittar man också det gamla, till exempel i Morby eller Träskända. Man förstår frestelsen att i korsningen av två av landets största motorvägar, Åboleden och Ring III:an bygga ett megalomant shoppingparadis. Men det kommer ohjälpligt att ha stora effekter på trafikmängderna och hela miljön. Man kan bara hoppas att projektet ännu stoppas. Dessa jätteprojekt hör till en förgången tid. Eller borde åtminstone göra det.

View Larger Map

lördag 15 februari 2014

Automatisk strukturering av innehåll och distanserad "läsning"

Digital Humanities Finland-nätverket i Finland ordnade i går sin första workshop i Nationalbibliotekets utrymmen i Helsingfors. Tanken med träffarna är att utbyta erfarenheter forskare, discipliner och institutioner emellan i en situation där ett nytt sätt att göra humanistisk forskning håller på att växa fram.

Det var otroligt fint att nästan trettio personer samlats för att diskutera s.k. text mining och topic modelling. Det handlar alltså om att göra statistiska analyser av text, som hjälper forskare att hitta mönster som kan vara osynliga för en mänsklig läsare på grund av textkorpusarnas stora omfattning. Jag tror jag vågar säga att dagens datahumanister är mindre positivistiskt orienterade än sina föregångare för några decennier sedan. Relationen mellan det kvantitativa och kvalitativa i forskningen är en av de mest intressanta frågorna inom digital humaniora i dag, anser jag själv, och det är en fråga som också ständigt tangeras, också i går. Det handlar inte (längre?) om att de kvantitativa "bevisen" prioriteras framom "subjektiv" mänsklig kunskap och tolkning, utan att kvantitativa och andra dylika metoder kan användas som stöd i argumentation och för att hjälpa forskare att hitta intressanta (för oss relevanta) mönster, strukturer eller anomalier, som behöver studeras närmare.

Professor Mats Fridlund inledde med att presentera en genomgång av användningen av dessa metoder i historisk forskning. Vad han har tillsammans med René Brauer var ute efter var, om man faktiskt fått fram någon ny kunskap genom att använda topic modelling, dvs att med statistiska sannolikhetsmetoder ta fram olika teman eller ämnesområden ur textkorpusar. Svaret var i princip nekande: de artiklar som lokaliserats var närmast tekniska test, som innehållsmässigt snarast bevisade saker man redan visste, de var oftast alltså vad man kallar proof of concept. Tekniskt utbildade personer var starkt representerade bland skribenterna, inte sällan unga män. Att humaniora varit drivande, eller att helt ny substantiell kunskap tagits fram, var inte alls klart. Fast ett litet glädjande exempel hade Fridlund precis fått i handen i form av en färsk artikel av Timothy Tangherlini och Peter Leonard, som faktiskt verkar ha hittat helt "nya" danska litterära modernister med dessa metoder (i Poetics, artikeln finns på Science Direct till det facila priset av knappa 40 dollar (39,95), har dock inte läst den så inköp sker på egen risk).

Följande presentation hölls av Hannes Toivanen från VTT, som tillsammans med Arho Suominen arbetar med att analysera material kring forskning med dessa metoder. Till exempel kan man jämföra på vilka områden det görs forskning och på vilka områden det ges mest patent. Cloun är att göra detta utan att se till vad forskarna själva eller någon bibliotekarie påstår att de sysslar med i sina rubriker, ämnesord eller klassificering, utan att göra det utgående från det faktiska innehållet i texterna. Det tuffaste var att Toivanen inte ens efter analysen vill kategorisera innehållsklustren med några etiketter, utan de representerades bara av ordmoln. Varje ords storlek representeras alltså då av sannolikheten att det förekommer i samma kontext (chunk) som de andra orden i molnet. Om jag förstod saken rätt. Noteras kan att överlappningen mellan var forskning görs och var patent ges verkade vara liten. Kanske skaffar universiteten lite patent? Kanske är det till och med bra?

Själv funderade jag ändå lite på hur mycket själva språkbruket inom specifika discipliner eventuellt döljer att man kanske substantiellt forskar i samma saker inom olika discipliner. Eller tvärtom. Epistem, den teoretiska referensram och de metoder man använder avspeglas ju givetvis i språkbruket - men säger det allt om substansen? Att man använder de senaste buzz wordsen i sin abstract eller ansökan? Nya digitaliseringsprofessorn Timo Honkela tangerade frågan om ordens innebörd senare i sin egen presentation, men han resonerade egentligen tvärtom och nämnde Wittgenstein som argument: att kontexten ger orden sin betydelse. Som semiotiker är jag lite skeptisk till ett så enkelt resonemang (och slå ihjäl mig, kallade Wittgenstein enkel ...). Dessutom nämnde Honkela detta bara i förbifarten och han har säkert mer utvecklade tankar kring detta. Jag hoppas jag snart får tillfälle att tala mera med honom.

Nästa var bokhistorikern Ilkka Mäkinen som på ett mycket intressant sätt diskuterade samspelet mellan kvantitativa och kvalitativa metoder. Hans senaste forskning hittar man via en tidigare essett. Hela tiden, av alla talare, underströks det hur viktigt det är att känna sin data, sitt ämne och kontexterna för att kunna göra meningsfulla och korrekta kvantitativa undersökningar. Att "distansläsa" en miljon böcker eller andra texter, betyder ingalunda att man slipper läsa hundratals och tusentals texter själv. Det är bara något man kan göra därtill.

Sist ut var Petri Paju och Timo Honkela, som berättade om olika metoder och projekt de jobbar med. Honkela förespråkade, liksom Toivanen, att man inte krånglar till saker för mycket. Enkla metoder är begripliga och transparenta. Honkela har bland annat sysslat med just att ta fram nyckelord genom frekvensanalys (Likey). Trots att de ännu i princip var ganska långt på proof of concept spåret, verkade det otroligt lovande och redan många av de exempel de kastade fram väckte många nya (forsknings)frågor, åtminstone hos mig. Jag vågar hoppas att vi rätt snart får intressant ny kunskap tack var vår nya professor Honkela. Ur forskningsdata- och arkivperspektiv är den framväxande forskningen fortfarande minst sagt utmanande.

Som helhet var dagen otroligt givande. Planeringen hade helt skötts av Mats Fridlund denna gång, men jag hoppas i framtiden kunna bidra mera, bara omständigheterna lite lugnar sig ....

Superenkel textmining med Wordle (endast frekvens).
Här innehållet i bloggen Historia i en digital värld.

onsdag 12 februari 2014

Varför öppna och länka data?

I går ordnade Brages Pressarkiv tillsammans med Kulturhuset, Magma och Finlandssvenskt samarbetsforum ett seminarium för finlandssvenska beslutsfattare om länkad öppen data.

Trots ett visst manfall bland både talare och publik blev dagen rätt lyckad, tror jag. Jag hoppas i alla fall att alla som var med fick en uppfattning vad öppenhet betyder i praktiken (maskinläsbarhet), betydelsen av metadata och varför det är smart för en språklig minoritet att samarbeta kring just länkning av data. Vår utmaning var ju att diskutera detta utan att det skulle bli för tekniskt, för som vår keynotetalare Lars Lundqvist sade, handlar öppenhet allra mest om en insikt och vilja hos ledningen att arbeta strategiskt med delaktighet och för engagemang med omvärlden.

Ett ord som användes om och om igen under dagen var hittbarhet. Ur olika perspektiv tangerades frågan om hur viktigt det är i dag att skapa ordning bland alla material och resurser, både internt och externt. Allt detta handlar förstås om metadata, att man måste beskriva sina innehåll - och att det måste göras maskinläsbart.

Pondus har kommit en god bit på vägen med detta. Under dagen lanserade vi en plan om de nästa stegen för att gå vidare. Som modeller och inspiration har vi bland andra Helsinki Region Infoshare och K-samsök. Tanken är att närmare samarbete och större integration ger mera synergier, synlighet och bättre genomslag också utanför det finlandssvenska. Vi vill bygga data.sve.fi, som är både en datakatalog, en gemensam maskinläsbar metadataresurs och en söktjänst. Idén är att betjäna tre grupper: gemene webbanvändare direkt, utvecklare och externa tjänster och sist men inte minst de deltagande organisationerna själva.

söndag 9 februari 2014

Wikipedianer, Wikimedia och stiftelsen

I går spreds en nyhet som handlade om penninginsamlingen kring Wikipedia i Finland. Jag tänker inte gå dess närmare in på den saken eller juridiken kring det hela här, men jag vill gärna reda ut några begrepp, eftersom det verkar vara lite oklart för många hur arbetet kring uppslagsverket är upplagt. Strukturen har tre olika delar, allt för att säkra innehållets oberoende.

1. Stiftelsen för Wikimedia som finns i USA som finansierar verksamheter och projekt.
2. Wikimedia-föreningarna i olika länder som främjar verksamheten i olika länder.
3. Communityn av frivilliga wikipedianer som i praktiken håller i det redaktionella arbetet, granskar kvaliteten och hjälper och stöder alla skribenter.

Den finska Wikimedia-föreningen hittar man här och föreningen har också en blogg. De finska wikipedianerna hittar man i Kafferummet på finska Wikipedia. De olika verksamheterna hålls faktiskt helt skilda, så det är till exempel ingen vits att kontakta föreningen gällande innehållet i uppslagsverket, då är kafferummet rätt adress.

Essetter