lördag 23 oktober 2010

Forskardriven digitalisering

I fredags gjorde jag en snabbvisit på de första Historiantutkimuksen päivät i Jyväskylä för att delta i en session om digitalisering och forskning. Själv hann jag inte riktigt delta i något annat program, men kolleger jag talade med var mycket nöjda med programmet. I synnerhet Maria Ågrens key note gjorde stort intryck. Man får hoppas att material från konferensen publiceras på webben.

Min egen presentation var en mycket allmän genomgång av olika aspekter på hur digitaliseringen påverkar forskningen i historia, genom de kvalitativa och essentiella förändringar som påverkar källor, källkritik, forskningsmetoder och publicering. Både före och under sessionen (både IRL och på Facebook) aktualiserades särskilt ett problem som av många forskare upplevdes som rätt akut: de tusentals och åter tusentals fotografier av källor som forskarna har på sina datorer. De är ofta av rätt dålig kvalitet och fyller ingalunda några som helst kvalitetskrav för digitalisering. Men de är trots det värdefulla på grund av allt det arbete som lagts ner, och vad viktigt är, de är material som annars är otillgängligt utanför arkivet och inte ens förtecknat på den nivå som forskarna nu dokumenterat. Bilderna kunde alltså fungera som sökhjälp för andra forskare.

Själv anser jag att arkiven å det snaraste borde skrida till åtgärder, för att denna resurs inte skall gå förlorad. Det borde ske i tre steg:

- Först borde man ge en plattform för forskare där de kan ladda upp sina bilder och förse dem med rudimentär metadata, t ex vilka arkivsignum det rör sig om och när det är fotat. För varje bild borde det också finnas möjligheter att tillägga egen beskrivande metadata, också för andra användare. En sökfunktion borde tillfogas. Det kunde till och med göras till en förutsättning för att man får fota, att man delar med sig av bilderna på webben om materialet ger möjlighet till publicering.

- För det andra borde man skapa förutsättningar att digitalisera bättre: erbjud forskarna utrustning: hyfsade skanners och bord med kameror, ljus osv och ett datasystem som gör att man direkt kan föra in kopior och metadata an efter.

- Som tredje och sista steg föreslår jag att man ger forskare möjlighet att beställa digitalisering till mycket lågt pris, så att det kan göras mycket enkelt direkt från katalogen eller plattformen med lågkvalitetsmaterial. De material som forskare behöver ad hoc borde inte prioriteras lägre än arkivens egna digitaliseringsprogram.

Detta är ändå fortfarande inte alls ännu forskardriven digitalisering, såsom den borde se ut enligt mig. Forskarna borde tas med i planeringen av processer och system och man borde utveckla indexering och sökfunktioner i nära samarbete med pågående forskningsprojekt. Man borde planera hur materialet behandlas (maskinläsbarhet, korrektur, annotering) i samråd med forskarna och låta deras behov och prioriteringar styra. Det handlar nämligen också om att kunna ge mervärde åt det digitaliserade materialet på samma gång: om det används av forskare kan man med samma ta tillvara och publicera kontextuell information och analys, som blir allt viktigare i takt med att googlandets kultur sprider sig. Den ställer mycket stora krav på hur material presenteras på webben.

I grund och botten handlar det om att man måste våga släppa kontrollen över varje detalj. Det är inte hållbart att bara resonera kring kvalitet och autenticitetsproblem och samtidigt låta den enorma potential som finns i samarbete med forskarna och crowdsourcing bara rinna en ur händerna. Friskt vågat är hälften vunnet. En mycket bra tankeövning som min kollega Tove Ørsted brukar applicera lyder som följer: vad är det absolut värsta som kunde hända om vi publicerar eller tillåter detta? Det visar sig ofta att den rädsla och oro som finns inför öppenhet är mycket diffus och inte sällan helt ogrundad. Kontroll innebär inte automatiskt hög kvalitet och trovärdighet är också ett mer komplicerat begrepp i webbvärlden än tidigare. Att inte kunna skrida till handling eller att inte vara öppen kan i dag uppfattas som mycket negativt för trovärdigheten.

3 kommentarer:

  1. Tack Jessica ;) Genomskinlighet, tillgänglighet, frihet! Vi kämpar vidare!

    SvaraRadera
  2. Jättebra! Det talas en hel del om att forskare måste tillgängliggöra data men väldigt lite om hur det ska gå till. Särskilt inom humaniora. Jag tycker du ger en hel radda bra förslag.

    SvaraRadera