fredag 15 maj 2015

Digital humaniora i praktiken

I dag var det final för Digital Humanities Hackathon i Helsingfors. Alla fyra team hade kommit fram till intressanta resultat som kommer att presenteras närmare i Helsinki Digital Humanities-bloggen nästa vecka. Den första gruppen hade valt ett aktuellt ämne: unionen mellan Skottland och England: Historical events and conceptual change in 18th century England. Som rubriken antyder handlade det dock om debatten under 1700-talet och unionens uppkomst 1706-07. Materialet var en brevkorpus, där man med maskinella metoder tog fram brev där Skottland och England nämndes. Vidare närlästes alla de brev där båda nämndes. Arbetet visade på ett fint sätt hur distans- och närläsning kompletterar varandra. Betydelsen av tolkning och substanskunnande försvinner minsann ingenstans i och med att man tar hjälp av digital metoder, men det kan hjälpa en att hitta mönster och nya frågeställningar.

Samma tendens kom fram i ett annat arbete, som handlade om hur glödlampan diskuterades och introducerades och diskuterades i finlandssvenska tekniska tidskrifter kring sekelskiftet 1900. Genom att analysera de ord som fanns i närheten av ordet fick man fram tydliga teman som behandlades.

Antti Kanner visar hur de olika kontexterna som glödlampan
behandlas i tydligt sammanfaller med vissa tidsperioder.
Upptäckten kan hjälpa vidare vid formuleringen av forskningsfrågan.

Tack vare metadata kan man göra dylika operationer. Det är en förutsättning för dylika metoder att man har tillräckligt strukturerad information om sin data, så att man vet till exempel tryckåret. Även gällande arbetet med brevkorpusen ger just metadata om breven och deras skribenter viktigt mervärde för forskarna om kontext, såsom ort eller social status. Metadata är dessutom oftast av en avsevärt bättre kvalitet än maskininläst text, som endast kan ge riktgivande resultat.

En annan grupp, som arbetade med socialistisk press, hade en lite annan ansats och tacklade problemet med bristerna i datas kvalitet på ett smart sätt: man analyserade skillnaderna i de mest frekventa orden i korpusen med socialistiska tidningar jämfört med hela tidningsmaterialet. Målsättningen var att ringa in nyckelbegrepp i den finska socialismen. Vilka tidningar som var "socialistiska" hade man hämtat ur tidigare forskning. Uppenbara och intressanta skillnader kom fram. Uppenbara när man såg dem, men kanske inte alltid självklara. Exemplet sporrade igen en diskussion om skillnaden mellan begrepp och ord och om historikernas behov av att se till betydelser och tolkning. Till exempel används vissa begrepp periodvis i ett ironiskt syfte eller parodiskt, vilket igen visar på hur forskarna i dylika projekt pendlar mellan metoder och utvecklar tekniken och frågorna iterativt. De tekniska lösningarna verkade inte vara så svåra för kodarna, utmaningen ligger ofta i att behandla data på ett bra sätt, inte sällan just genom att testa sig fram med vad som fungerar.

Gud vs Marx under sekelskiftet 1900 i socialistisk press
- vad kan man dra för slutsatser utgående från en sådan graf?
Åtminstone säger det en del om det "register" man hade till
förfogande, som kommentatorn Caroline Bassett kallade det.

Den sista gruppen jobbade med Finnairs Blue Wings-tidning och marknadsföringen av Finland i den, vilken man kan säga det handlar om i en dylik kontext. Deras arbete var annorlunda genom att man använde sig av en visuell ansats och maskininlärning kompletterad med topic modelling. Det intressanta var, tyckte jag, att man tagit fram en metod som i praktiken är oberoende av språk och medieformat (dock visuellt förstås i detta skede). Min första tanke var att de tvingats till onödigt komplicerade metoder, men vid närmare eftertanke kom jag till att det var närmast genialt.

På det hela taget var hackathonet en succé och förde dessutom samman en massa nyckelpersoner på området. Vad som var synd var att inga finlandssvenska institutioner som har verkligen fina dataset var med. Man hoppas det blir ett återkommande evenmang!


Inga kommentarer:

Skicka en kommentar