Samma tendens kom fram i ett annat arbete, som handlade om hur glödlampan diskuterades och introducerades och diskuterades i finlandssvenska tekniska tidskrifter kring sekelskiftet 1900. Genom att analysera de ord som fanns i närheten av ordet fick man fram tydliga teman som behandlades.
Antti Kanner visar hur de olika kontexterna som glödlampan behandlas i tydligt sammanfaller med vissa tidsperioder. Upptäckten kan hjälpa vidare vid formuleringen av forskningsfrågan. |
Tack vare metadata kan man göra dylika operationer. Det är en förutsättning för dylika metoder att man har tillräckligt strukturerad information om sin data, så att man vet till exempel tryckåret. Även gällande arbetet med brevkorpusen ger just metadata om breven och deras skribenter viktigt mervärde för forskarna om kontext, såsom ort eller social status. Metadata är dessutom oftast av en avsevärt bättre kvalitet än maskininläst text, som endast kan ge riktgivande resultat.
En annan grupp, som arbetade med socialistisk press, hade en lite annan ansats och tacklade problemet med bristerna i datas kvalitet på ett smart sätt: man analyserade skillnaderna i de mest frekventa orden i korpusen med socialistiska tidningar jämfört med hela tidningsmaterialet. Målsättningen var att ringa in nyckelbegrepp i den finska socialismen. Vilka tidningar som var "socialistiska" hade man hämtat ur tidigare forskning. Uppenbara och intressanta skillnader kom fram. Uppenbara när man såg dem, men kanske inte alltid självklara. Exemplet sporrade igen en diskussion om skillnaden mellan begrepp och ord och om historikernas behov av att se till betydelser och tolkning. Till exempel används vissa begrepp periodvis i ett ironiskt syfte eller parodiskt, vilket igen visar på hur forskarna i dylika projekt pendlar mellan metoder och utvecklar tekniken och frågorna iterativt. De tekniska lösningarna verkade inte vara så svåra för kodarna, utmaningen ligger ofta i att behandla data på ett bra sätt, inte sällan just genom att testa sig fram med vad som fungerar.
Den sista gruppen jobbade med Finnairs Blue Wings-tidning och marknadsföringen av Finland i den, vilken man kan säga det handlar om i en dylik kontext. Deras arbete var annorlunda genom att man använde sig av en visuell ansats och maskininlärning kompletterad med topic modelling. Det intressanta var, tyckte jag, att man tagit fram en metod som i praktiken är oberoende av språk och medieformat (dock visuellt förstås i detta skede). Min första tanke var att de tvingats till onödigt komplicerade metoder, men vid närmare eftertanke kom jag till att det var närmast genialt.
På det hela taget var hackathonet en succé och förde dessutom samman en massa nyckelpersoner på området. Vad som var synd var att inga finlandssvenska institutioner som har verkligen fina dataset var med. Man hoppas det blir ett återkommande evenmang!
Inga kommentarer:
Skicka en kommentar