onsdag 13 maj 2015

Digitalt morgonkaffe

Genom att parallellt utnyttja maskininlärning, medieteori, etnologiska metoder och socialteori kan man faktiskt få ut ett och annat intressant ur den stordata som finns i sociala medier och nyheter. Men processen är iterativ och integrerad. På tisdagsmorgonen fick vi höra om ett par sådana projekt på en tillställning som ordnades av kommunikationsforskningscentret CRC och CSC i Tankehörnan i Porthania.

Salla-Maaria Laaksonen och Matti Nelimarkka presenterade sitt projekt Digivaalit där de samlat in data under valkampanjen. De intresserar sig för hur maktstrukturer återspeglas på webben och använder sig av API:er. Det viktiga och intressanta, tycker jag, är just själva processen vid insamling och urval av data samt utvecklingen av metoder, förutom att man förstås får fram en hel information om vad som rör sig i offentligheten. Hela processen handlar mycket om att testa, fundera, analysera under arbetets gång. Detta är en förutsättning för att få fram meningsfull information, men kräver långsiktigt samarbete av personer med olika kompetenser. Man formar alltså dataseten under forskningens gång, vilket också kräver en del dokumentation. Dessa dataset kommer också sannolikt att vara oerhört viktiga för framtidens historiker, eftersom det är material som inte nödvändigtvis på annat sätt finns tillgängligt om några år.

Exempel på information som Salla Laaksonen och Matti Nelimarkka tagit fram under valkampanjen inför vårens val.


Det andra större projektet som presenterades är Citizen Mindscapes, där man jobbat med data från Suomi24-portalen. Krista Lagus berättade om samarbetet med ägaren och vilka oerhört intressanta frågor man forskar i. Dessutom berättade Tuomo Hiippala om sin forskning multimodalitet med hjälp av maskininlärning. Det är ju viktigt att minnas att den medieintegration som äger rum nog kommer att kräva att vi inte bara stirrar oss blinda på texten, bara för att de öppna och tillgängliga bra metoderna i huvudsak (enligt min uppfattning) handlar om text.

Utmärkande för denna typ av forskning som faktiskt genererar ny kunskap i större grad är att den är gränsöverskridande också vad gäller institutioner och kräver teamarbete. Mycket resurser behövs  för teknisk utveckling, men processen måste styras av forskningsfrågan. Samtidigt tycker jag det är viktigt att tänka på att de verktyg som skapas och den forskningsdata som uppstår också är viktiga resultat som bör värnas om och inte tappas bort, varken som publikationer eller meriter. Också balansgången mellan den egna forskningsfrågan och existerande data och metoder kräver uppmärksamhet: att inte uppfinna hjulet på nytt, att inte bygga inte silon eller saker som inte kan återanvändas om man kan undvika det, men samtidigt låta den egna kontexten och forskningsfrågan styra arbetet.

Själv ser jag att här behövs en hel del arbete vad gäller de nationella infrastrukturerna: hur kan vi stöda uppkomsten av data och verktyg som är tillräckligt flexibla, men ändå enhetliga? Jag tror inte att det kommer att spontant ske något sådant, utan det kommer att behövas en organisk men målinriktad process, som innebär någonsorts användarcentrerad (forskningsstyrd) informationsförvaltning för hela fältet för digitalhumaniora och kulturarv. När vi rör oss från studier i språket till studier inom kultur och samhälle, kommer det allt mer att handla om tolkning och betydelse, vilket ställer nya krav på hela systemet. Bland annat metadata blir allt värdefullare och mer viktigt på grund av att den är relativt sett semantiskt mycket rik och berättar om kontexter, både historiskt och i samtiden. Hashtaggarna som Digivaalit forskar i är ju också en sorts metadata ...


Inga kommentarer:

Skicka en kommentar