söndag 31 oktober 2010

Hur smart får man vara?

På den senaste Europeana-konferensen presenterades ett intressant projekt som heter Old Weather. Jag blev bums imponerad av konceptet, som går ut på att låta användare skriva ut information från digitaliserade dokument. Det handlar om data som intresserar både historiker och klimatforskare. Materialet består av loggböcker från första världskriget.

Efter att ha registrerat mig och bekantat mig lite mer med upplägget är jag ännu mer fascinerad. Det hela är i själva verket upplagt som ett historiskt reality-spel, som säkert kan bli mycket medryckande för den som beger sig "med på resa ombord" på ett fartyg. Ju mer man fyller i data, dess högre gradbeteckning får man. Man kan också tänka sig att de olika fartygen tävlar sinsemellan, eftersom det är lätt att se hur arbetet fortskrider på de olika skeppen.

För vetenskapsmannen infinner sig förstås frågan om källkritik: kan man lita på alla enskilda data, att de är rätt inmatade? Tänk om det uppstått fel av misstag eller om någon avsiktligt systematiskt fyller i felaktiga data? Old Weather-projektet (som alltså är ett samarbete med bl a JISC, The National Maritime Museum och University of Oxford) säger att uppgifterna kollas, i synnerhet synas fall där det förekommer anomalier eller osannolika uppgifter.

Man måste ändå beakta att vi i dagens läge ofta har att göra med svindlande mängder information, vilket gör att enstaka små fel är av betydelse endast om de citeras direkt som enskilda separata uppgifter. I ett sådant fall måste man givetvis gå tillbaka till källan och kontrollera detaljerna. Detta gäller egentligen både forskaren och den som citerar densamma. Det är precis exakt så vi resonerat kring databasen Henrik också. Av stora mängder data kan man visst dra vissa typer av slutsatser. Avvikelser måste man granska noggrannare, men en detaljerad källreferensdatabas hjälper en också sannolikt snabbt fram till det exakta stället att kolla en detaljuppgift eller intressant anomali. Det här resonemanget innebär att enstaka slag- eller slarvfel eller feltolkningar inte är ett problem för forskningens trovärdighet.

Det andra slaget av fel utgörs alltså av systematiska fel av sådan omfattning att de förvanskar helhetsbilden och därmed forskningsresultaten. Detta kan man komma åt med stickprov, som man absolut måste göra, då man baserar sin forskning på dylika material. För det andra inställer sig nog också frågan: vem i all världen skulle sätta hundratals timmar på att mata in felaktiga uppgifter i forskningsmaterial, som man kanske inte ens vet exakt hur det kommer att användas av forskare? Lite credits åt allmänheten, tack!

2 kommentarer:

  1. Låter intressant! Om källkritik: Hiski ser man i många historieböcker och -artiklar som källa utan ett enda ord om trovärdighet...

    SvaraRadera
  2. Gällande Hiski-databasen: Så är det nog. Det är sant att den också lockar till slarv. Å andra sidan måste man ju, tycker jag, varje gång också avväga hur stor betydelse en uppgift har för ett resonemang och hur mycket tid det är rimligt eller möjligt att sätta på att kolla upp enskilda detaljer. Själv tycker jag att det varierar från fall till fall. Så länge man faktiskt uppger att man använt t ex Hiski som "källa" för en uppgift, kan och skall var och en avväga själv vilken vikt man ger åt uppgiften. De verkliga problemen uppstår ju om informationen sedan lever vidare på annat håll som om den faktiskt vore kollad på mikrofilm eller i originalkällan.

    Men i webbvärlden blir det förhoppningsvis allt enklare att följa upp dylika citatkedjor.

    SvaraRadera