lördag 30 augusti 2014

Om jag inte vore så trött ...

... skulle jag skriva ett blogginlägg där jag demonstrerar olika sökmetoder och kvalitetsskillnaderna i resultaten. Nu kan jag bara hoppas att folk själva testar t ex Presstanda och jämför relevansen i sökresultaten med att googla eller göra sökningar i tidningarnas egna arkiv eller webbsidor. Poängen är snarast att man behöver flera sökmetoder, om man vill ha kvalitet på sina sökresultat. Resultaten är mycket olika med olika metoder. Att behärska sådant kallas informationskompetens och det är en grundläggande färdighet i dagens informationssamhälle.

Nu orkar jag bara hänvisa till tidigare inlägg (detta är trots allt frågor jag jobbat med och skrivit om i åratal) om t ex hashtags och vikten av bra söksystem och en naiv tro på google som någon sorts perfekt och heltäckande index för all information i världen.

Tidningarnas egna intressen och möjligheter gällande bättre grepp om sina material och en smartare, modern informationsförvaltning, som skulle ge chanser att utveckla tjänster på nya sätt och använda tillgångar bättre, har jag också skrivit om. Att Brages Pressarkiv och Presstanda är en existerande infrastruktur och effektiv resurs, som man riskerar förslösa, kan alltså bara beklagas.

En sak som också är viktig att betänka är att man då man använder big data i forskning (vilket man bör anse fulltextsökningar i textmassor vara!) är att frågor om semantik, kvalitativa dimensioner och kontextkännedom är helt centrala. Jag hoppas därför att man faktiskt för en grundlig kritisk diskussion om vilka konsekvenser det har för forskningen (både dess metoder och kvalitet!) om man helt överger kvalitativa metoder till fördel för kvantitativa (skalan är i praktiken alltid glidande, förstås, men förskjutningen är enorm). I synnerhet i ett läge då vi inte riktigt ännu ser hur t ex topic modelling kunde användas för att hjälpa med att förbättra relevans i fulltextsökningarnas resultat.

En grundläggande poäng inom digital humaniora är nämligen att man för att kunna göra tillförlitlig forskning helst ska kunna belägga ett påstående med flera olika metoder. Detta av den enkla orsaken att det ofta kan vara det i praktiken enda fungerande sättet att testa metoder, dvs de algoritmer som ligger i grunden för forskningen (= en del av forskningsmetoden som ofta är ogenomskinlig). Om man väljer bort att jämföra/beakta resultaten fulltext/indexerade material är frågan om man försämrar forskningens trovärdighet med 50 eller 100%. Tillspetsat. I alla fall är detta något man bör vara medveten om, i fall man beslutar att lägga ner indexeringsverksamheten vid Brages Pressarkiv - som är mycket förmånlig och av god kvalitet.

Jag har gjort vad jag kan för saken. Nu är det upp till dem som ska ta eller kan påverka besluten vid SLS, ministeriet, Nationalbiblioteket osv. Jag kan bara hoppas man inser vidden av konsekvenserna för forskning och kulturarv när man fattar besluten. Vad är god framtida forskning och finlandssvenskt digital kulturarv värda för oss?

måndag 11 augusti 2014

Pressarkivets framtid

Jag skrev en kommentar till de olika alternativen om Brages Pressarkivs framtid.

söndag 10 augusti 2014

Hemulen och Filifjonkan på scen

Tove Janssons hundraårsdag har firats på många håll. Bland annat ordnades i dag i Borgå ett fint seminarium kring barnlitteratur, Tove Jansson och barnboksillustration. Det var en upplevelse att se Stella, Linda och Annika tolka både jubilarens och sina egna verk. Hemulens uppsättning av Janssons bilderböcker var en komplicerad och rolig tolkning - jag är övertygad om att hon själv skulle ha älskat den. Att Gnatto Pakpak kunde dramatiseras var mer än jag kunnat tro (finns förresten också som app). Jag vet inte om släktskapsband gör en jävig, men jag tycker det vore verkligen bra om föreställningen kunde dokumenteras. Tyvärr blev mina egna foton helt värdelösa ...
Tvättmaskin ur Öden och döden.

lördag 9 augusti 2014

TEI i Tallinn

På torsdagen och fredagen ordnades en workshop kring bokhistoria och digital humaniora i Tallinn. Vi inledde med en introduktionskurs i xml och TEI-annotering på torsdagen och på fredagen hade föreläsningar och samtal kring ämnet. Vi hade många intressanta diskussioner. Vi pratade också om behovet av institutionellt och informellt samarbete och information. I dag är det svårt för forskare att veta hur man i praktiken ska gå tillväga, om man vill arbeta med dessa verktyg och det kan vara svårt att lokalisera relevanta material, projekt och verktyg. Själv talade jag om olika principiella aspekter på temat historia och digital humaniora.