måndag 27 februari 2012

En vädjan till regeringen

I regeringsprogrammet sägs: ”Öppnandet av digitalt material vid bibliotek, museer och offentliga konstinstitutioner att fritt användas av medborgarna främjas.” Längre fram står det att ”Informations- och kommunikationsteknikens betydelse för förbättrandet av tillväxten och produktiviteten är avgörande”, samt att ”... det digitala informationsmaterial som den offentliga sektorn administrerar ska göras tillgängligt för medborgarna, företag, organisationer och myndigheter samt för forskning och utbildning via informationsnät och i en form som gör det lätt att återanvända.” Det talas vidare om kompatibilitet och gränssnitt för offentliga system. Dessa är viktiga och bra ställningstaganden, som syftar till åtgärder som kommer att stärka vårt land på många sätt.

Under många år har The Semantic Computing Research Group vid Aalto uni (tidigare TKK) framgångsrikt utvecklat tekniker för effektiv informationshantering. Samtidigt har informationssamhällets utveckling i Finland bromsats upp av att de goda tillstymmelser till nationella ontologiska lösningar som utarbetats vid SeCo inte fått en ordentligt driftmiljö. De investeringar och innovationer som gjorts har i praktiken blivit outnyttjade under flera år. För att kunna skapa en bra grund för den offentliga sektorns – och alla andras – informationsförvaltning i vårt land behövs stabila fungerande lösningar på detta område. Dessa ontologier utgör en nödvändig gemensam grund för att utveckla tillgänglighet och återanvändning av så väl kulturarvsmaterial som all annan information.

Ontologierna fungerar nu i utvecklingsmiljöer där resurser i onödan går åt till att försöka hålla systemen i gång. Detta borde skötas av instanser som Nationalbiblioteket som har kompetens gällande metadata och möjlighet att sätta upp en driftmiljö, eller exempelvis Statskontoret, om ingen annan tar hand om detta. Vid Nationalbiblioteket har man med hänvisning till resursbrist inte åtagit sig uppdraget, utan i åratal har det ältats om ett konsortium som skulle sköta detta. Idén har tydligen varit svår att förverkliga.

Varför inte tilldela någon myndighet ansvaret och ge tillräcklig finansiering? Det börjar bli bråttom. Liksom öppnandet av data är detta en åtgärd som alldeles garanterat gynnar nationalekonomin mycket snabbt genom att skapa en bra teknisk infrastruktur för alla aktörer att bygga vidare på. Exempelvis blir det Nationella Digitala Biblioteket en halvmesyr utan utnyttjande av ontologier. Detta är ett alldeles avgörande område där det behövs styrning på nationell nivå. Behovet av nationella ontologier är akut liksom av en nationell länkserver. Samtidigt kunde Riksarkivet överta JUHO-ontologin över myndigheter och vidareutveckla den då man utvecklar sina egna system. Det nationella perspektivet borde hela tiden finnas med, då dessa institutioner utvecklar sina tjänster, eftersom man ändå är tvungen att öppna sin data.

Allt flera aktörer som vill öppna och länka sin data är nu beroende av dessa opålitliga system, för att inte tala om hur många år man fördröjt utvecklingen genom att många instanser inte alls vågat ta i bruk tekniken. Finland börjar på grund av oförmåga att hitta en rationell och effektiv administrativ lösning på detta vara på efterkälken i den internationella utvecklingen.

Jag vädjar därför nu till regeringen, i synnerhet finansminister Urpilainen, kulturminister Arhinmäki och undervisningsminister Gustafsson att snarast se till att detta åtgärdas, så att hela den offentliga sektorn – och alla andra – kan ta bruk de nya teknikerna utan onödiga osäkerhetsmoment. Annars finns risken att det uppstår en djungel av olika system. Hur effektivt det är har vi alla sett inom social- och hälsovårdssektorn.

Hur och varför man gör en databas

I dag berättade jag om att planera och göra upp databaser. Om man har stora mängder information som går att strukturera kan det löna sig att spara den som en databas, eftersom det gör det lättare att hantera och behandla informationen då.

Som exempel visade jag hur vi byggt upp den bokhistoriska databasen Henrik, som finns hos Finska Litteratursällskapet på bibliotekets webbsidor. Det är bäst att börja arbetet med att rita upp en modell av det man vill beskriva med databasen, exempelvis genom att rita upp en ER-modell. I modellen ritar man upp vilka entiteter som informationen behandlar och hur de olika entiteterna och deras egenskaper (attribut) förhåller sig till varandra. Modellerna kan sedan enligt några enkla regler förvandlas till en relationsdatabas.

När man skapar och använder dylika resurser vid sin forskning bör man också göra upp en plan för hela arbetet och inte minst planera vad som kommer att hända med materialet när man är färdig med sin forskning. Bra information om hur man gör finns hos Finlands samhällsvetenskapliga dataarkiv. Om man samlar på sig mycket olika filer, exempelvis bilder, behöver man också göra upp en databas för att hålla ordning på dessa. Där kan man spara metadata om varje fil. Man måste också tänka på att varje objekt måste ha en unik id, så att man kan skilja på alla dokument.

Om man inte har tillgång till databasprogram, kan man också använda vanliga tabelldokument. Fundera då noggrant på vilka fält eller kolumner som behövs. Det är alltid lättare att slå ihop olika fält än att dela på existerande fält. Lägg därför varje typ av information i ett eget fält. Fundera också på hur du kan dokumentera sökningar eller andra åtgärder som du gör under forskningsprocessen, så att du kan redogöra för dem efteråt.

lördag 25 februari 2012

Från imitation till copy-paste-kultur?

För länge sedan vara imitation en ädel konst. Jag avser inte nu det härmande och apande man idkar på scen i underhållningssyfte, utan konsten att efterlikna någon erkänt duktig förebilds alster i tal, skrift eller annan konst. Främst gällde det stil, att kunna bemästra olika stilgrepp på ett kreativt sätt. Skickligt gjorda pasticher och parafraser var uppskattad konst, hedrande för "offret", alltså förebilden. Det var hedersbetygelser. Om publiken sedan inte identifierande förebilden bevisade den ju bara hur obildad den var. Det var alltså före man hittat på detta med upphovsrätt.

Man började med att kopiera rakt av för att lära sig tekniken, för att sedan mogna i sin egen uttryckskonst och färdighet, så att man kunde ta sig lite större friheter och imitera. Detta gällde som pedagogisk metod i ämne som ämne i sekler. Komplexa saker, som brev och tal med otaliga retoriska element och nivåer, eller tavlor eller kompositioner, analyserades samtidigt som de kopierades. Också det man inte medvetet registrerade lärde man sig av exemplets och upprepningens kraft att intuitivt omfatta som estetiskt eller bra.

Sen kom romantiken och de stora geniernas epok: 1800-talet och början av 1900-talet. Samhället demokratiserades och konstnärerna behövde framhålla sin unika kapacitet för att försörja sig allt mer på marknadens villkor. Upphovsmannen och upphovsrätten föddes. Den "kreativa förmågan" koncentrerades i vissa personer, som länge behandlades som om de skapat mästerverk ur tomma intet. Replika förvandlades till plagiat. Det viktigaste var att vara originell, eller så kunde man glömma det där med att vara skapande eller konstnärlig. Imitation blev satir. Eller bara dåligt.

I dag ser vi redan annorlunda på saken. Vi ser att konst som inte refererar till annan konst eller samhället är innehållslös. Modern konst, exempelvis film, kräver intertextualitet. Publiken söker referenser, kommentarer till annan konst och diskussion, associationer, annars är verket bara banalt och platt. Jag tycker att just inhemsk film är ett ypperligt exempel på detta. Bra filmer är förutom dramaturgiskt och estetiskt bra även en del av ett större film- och konsthistoriskt sammanhang och ett inlägg i en större diskussion. Därför behöver folk som gör konst utbildning eller ett seriöst och brett eget intresse för de konstnärliga uttrycket i historiskt perspektiv. Dylika hänvisningar kräver imitation om de ska vara subtila, i synnerhet då det inte handlar om text.

Pelle Snickars inlägg i dagens Svenska Dagblad lyfter fram intressanta frågor kring detta med den digitala textens (och varför inte också de andra digitala materialens) karaktär och kopierandet som kreativ handling i dag.

Osökt kommer jag också att tänka på den diskussion om kuratering och redigering som förts på Yle. Kopiering, kuratering och redigering är färdigheter som är på väg upp. Återanvändning är lätt och intressant, och det har blivit uppenbart att olika slag av återanvändning kräver färdigheter. Exempelvis de otaliga fotoskämten om bilden av olika yrkesgrupper som på senare tid cirkulerat vilt på Facebook är ett tecken på att imitationen är på väg tillbaka. Fortfarande mest som folkkultur (för visst har ju folk sett sig tvugna att vara kritiska och förlöjliga skämten), men jag ser det nog som ett steg mot också imitationens återkomst.

fredag 24 februari 2012

Vårt gemensamma kulturarv

Jag följer igen med avund med skeenden i Sverige. Nej, inte diverse kungabarn, utan initiativet till samarbete mellan de svenska minnesorganisationerna (museer, arkiv och bibliotek) och det svenska Wikimedia. Trots att finska Wikipedia är en av de mest använda, är aktiviteten i form av samarbete med kulturarvssektorn svagt. Direkt pinsamt svagt om man ser till exempel till Wiki loves monuments-kampanjen. Den finska föreningen är liten och skulle definitivt behöva stöd av både offentliga institutioner och tredje sektorn.

Stödet behöver inte ens vara ekonomiskt, utan det kan gälla att ge innehåll till det icke-kommersiella projektet. Arkiven är sprängfyllda av digitaliserade material som ligger och väntar på att någon eventuellt ska hitta på att gräva fram dem (om de ens finns tillgängliga på webben) i krångliga databaser.

Har man ens övervägt att använda Wikipedia som marknadsföringskanal? I Tyskland har riksarkivet framgångsrikt marknadsfört sina foton via Wikipedia. I Finland finns det inte ens allmänt tillgängliga officiella porträtt av våra presidenter som man får använda. Alltså på riktigt. Det handlar om allas vår gemensamma egendom. Ibland blir jag så upprörd på att man inte får ändan ur vagnen med så enkla saker som detta.

onsdag 22 februari 2012

Lite hopp

Gläder mig oerhört över att Helsingfors Universitets personal vill sluta använda Mehiläinens tjänster. Det är ett fint test på hur strategifloskler faktiskt kan omsättas i praktiken och i förlängningen hur man vid konkurrensutsättning kan prioritera moraliska frågor framkom ekonomiska kriterier. Lika glädjande är biskop Askolas Ekofasta. Äntligen vaknar kyrkan och akademia. Jag misstänker att marknadsfundamentalisterna inte kan knäckas av humanismen ensam. Kyrkan måste ta ställning mer aktivt. Man måste hota de girigaste med evig förtappelse om vi ska få någon ordning på världen. Inte för att fundamentalreligiösa av olika skolor heller brukar visa särskilt mycket omtanke om nästan eller miljön. Men så mycket som vi utarmar vår planet och människorna, som aldrig förr, och fortfarande finns det för många som har mage att påstå att "det inte finns pengar". Det är nog något annat, mycket viktigare, som saknas.

måndag 20 februari 2012

Digitalbaserade material och LDB

Dagens föreläsning handlade om digitalbaserade material och om långsiktigt digitalt bevarande. Jag har behandlat ämnet ett antal gånger i bloggen och man kan får fram texterna genom att söka med nyckelordet långtidsbevaring (taggmolnet finns längst nere på sidan). Den mest grundliga genomgången finns här.

Digitalbaserade material, på engelska born digital objects, är en växande grupp material. Dessa material är framtida forskares källor … men vad ska vi bevara och hur är inga lätta frågor att besvara. Trots att nästan alla material i dag uppstår i digital form, behöver inte alla material bevaras digitalt, till exempel text och stillbilder går förhållandevis enkelt att göra om till fysiska objekt, som kan läggas i arkivmagasin och bevaras på traditionellt sätt.

Men till exempel webben innehåller mycket material som inte kan återges på ett sätt som liknar den ursprungliga användarupplevelsen utan en dator. De tekniker som man i dag använder för att ta tillvara webb utelämnar ändå en stor del av materialen av tekniska orsaker, exempelvis diskussionsforum blir ofta oinsamlade. För att rädda dem för eftervärlden behövs andra åtgärder.

Digitalt bevarande kräver aktiva åtgärder eftersom material så lätt kommer bort eller blir obrukbart utan planering och dokumentation. Bevaring är därför dyrt, mycket dyrare än det kostar att köpa en hög hårddiskar. Men vilka är de alternativa kostnaderna, för återskapande av information (om det ens är möjligt), för männsikors rättskydd, för vårt kulturarv?

söndag 19 februari 2012

Femte fakulteten

- Föreläsningar och tenter är helt bra, sa professor Klinge under vårt första studieår, men det mesta lär ni er i den femte fakulteten, i samtalen med äldre studenter.

Den femte fakulteten, det var huvudbyggnadens kafé. De fyra fakulteterna, den filosofiska, den teologiska, den medicinska och den juridiska, har alltid kompletterats av det inofficiella umgänget mellan akademiker, där vägen från student till lärare är en glidande process, där man aldrig blir fullärd och redan som mycket ung kan bidra och delta i diskussioner - om inte annat, så genom att ställa frågor. För det är just i diskussionen och argumentationen som forskningens essens finns.

När jag själv i veckan höll min provföreläsning för docentur (fy, vad nervöst det var fast man föreläst mycket och är väl förberedd) talade jag om Historievetenskapen och digitaliseringen. Med digitalisering avsåg jag då den förändring som vår kultur genomgår som bäst. Förändringen påverkar historikernas källor, forskning och den vetenskapliga kommunikationen. Jag har tidigare pläderat för det jag kallat att bedriva vetenskap för öppen ridå, och jag vidhåller att webben och de sociala medierna är ett bra och nödvändigt forum att föra den vetenskapliga diskussionen.

Många professionella forskare inser detta och stärker både forskningen i sig genom att öppet diskutera också halvfärdig forskning i offentligheten och samtidigt en intellektuell närvaro på webben genom att delta i de offentliga samtal som pågår i bloggar och mikrobloggar. Det krävs förstås en del anpassning att ge sig in sådana samtal, i synnerhet då många av oss fått sin utbildning under en tid då man var tvungen att väga varje ord man publicerade på guldvåg. Den rädsla för att förlora sin auktoritet och trovärdighet som håller tillbaka forskare från att exempelvis blogga ter sig ändå allt mer som en oacceptabel slutenhet och elitism. Varför panta på sin kunskap? Varför detta avfärdande av detta nya forum för den femte fakulteten som irrelevant eller mindre värt? Varför denna orimliga rädsla för att "slösa" tid eller förlora kontroll? Trots att jag inser att detta skifte av medium inte passar alla, hoppas jag ändå att alla akademiker skulle begrunda denna fråga och sitt etos som representant för humanismen och det kritiska tänkandet.

Men kaféerna försvinner ingenstans de heller. Jag är säker på att de inofficiella seminarier som under min studietid bedrevs på det legendariska Pam Pam, pågår i studentlokaler och på krogar fortfarande. Det är inte sällan där de stora insikterna föds. Jag ser mycket fram emot Historicus femtioårsjubileum och de intensiva diskussioner som alldeles säkert kommer att föras också där.

torsdag 16 februari 2012

Bokhistoriska databasen Henrik

I dag hade jag ett trevligt möte med den (rätt) färska professorn i bokhistoria Tuija Laine - den första i Finland och en av få i Norden. Vi har sedan många år ett roligt gemensamt projekt, som trots att det legat vilande en tid, stilla fortlevt på webben under beskydd av Finska Litteratursällskapets bibliotekschef Cecilia af Forselles. Det gäller den bokhistoriska databasen Henrik.

Bakom databasen finns i själva verket ett helt nätverk av bokhistoriker som varit inblandade på många sätt. Ett resultat av samabetet är boken The Emergence of Finnish Reading and Book Culture in the 1700s, som innehåller studier i finländsk 1700-tals bokhistoria. Eftersom vår krets fokuserat på bokägande och läsning är texterna mer kulturhistoriska än fokuserade på existerande gamla böcker. Inspirerade av Henrik Grönroos forskning har vi hämtat kunskap ur olika typer av bokförteckningar - vanliga människors läsande blev vanligare under denna tid. Det är just sådan information som samlats i databasen i en indexerad och sökbar form. Man kan där se vilka böcker en handelsman eller hantverkare ägde. I databasen har införts böcker från Helsingfors och Uleåborg.

Dagens möte handlade om fortsättningen. Vi kommer nu att få en praktikant som börjar föra in material från Åbo, så vi får ännu ett nytt material att jämföra med. Det ska bli spännande. Åbo var ändå universitetsstad. Hur skilde sig stadens bokkultur från de två andra städernas? Det återstår att se.

måndag 13 februari 2012

Ännu om film

Jag måste ännu tillägga några ord om digitalisering av film. Peter von Bagh, som måste anses vara en av de största experterna och en av vår tids stora intellektuella på området åtminstone i Europa, har ansett att det statsfinansierade digitaliseringsprojekt i våra biografer som är i sitt slutskede är en av det senaste seklets värsta kulturskandaler. Han utdömer digitaliserade versioner av gamla filmer både i både estetiskt och vetenskapligt hänseende. Endast mycket högklassig digitalisering av HD-kvalitet kan (möjligen) komma på fråga. Bildåtergivningen bedömer han i 999 fall av 1000 som fullständigt undermålig, och är skärrad över att filmforskare exempelvis skriver vetenskapliga texter om film utgående från diverse dvd-versioner. von Bagh anser att bildkvaliteten, ljuset, färgerna och känslan i riktig film inte kan återges digitalt. Han har förfäktat detta återkommande i synnerhet i tidskriften Filmihullu.

Det som förr hette Filmarkivet är i dag en del av det Nationella audiovisuella arkivet, där man samlar in och bevarar både tv, radio och film. Antti Alanen har fört en interassant blogg och han har också skrivit om digitalisering. Inlägget är gammalt och en del har väl förbättrats vad gäller standarder, men inlägget är belysande gällande villrådigheten inför de nya teknikerna. Kanske det ändå inte gått så illa, åtminstone ibland har ju tekniken varit till nytta, som man kan läsa i Kristin Thompsons och David Bordwells blogg.

Digitalisering av fotografier och ljud

Dagens föreläsning handlade om digitalisering av bild och ljud. Det blev av tvång rätt tekniskt med samplingsfrekvenser, färgdjup och filkomprimering. Avsikten var att illustrera hur mycket tekniska val man måste göra då man vill digitalisera material. Ibland är man ju tvungen att göra det bara för att rädda innehållet för eftervärlden, då mediets livslängd närmar sig sitt slut. Exempelvis videokassetter håller ju som bekant i princip bara ett decennium, ungefär, beroende på kvalitet och förvaringsförhållanden. Ofta gör man digitalisering för att öka tillgänglighet och användbarhet, exempelvis för smalfilmer eller fotografier på glasplåtar.

I princip vill man ju spara så mycket information som möjligt, och har man mycket tid och pengar kan man ofta spara mycket mer än vad de mänskliga sinnena behöver för att anse att kopian är lika bra som originalet. Ibland kan det till och med bli bättre då man kan förbättra exempelvis bilder eller ljud så att man själv kan få ut mera information av dem.

Om man vill bevara "originalet" måste man också ställa sig frågan vilket som är originalet: är det objektets nuvarande skick eller bör man till exempel försöka åstadkomma de "ursprungliga" färgerna i ett gulnat fotografi? Också här måste man kanske ibland fundera över upphovsmannens intention och fundera hur man borde beakta den. Och som vi konstaterade under föreläsningen borde man kanske här också, liksom vid textdigitaliseringen, försöka skapa olika versioner i den mån det är möjligt.

Digitalisering kräver mycket kompetens och förberedelser. Man måste prioritera och avgränsa, bestämma sig för teknik och processer. Det är också mycket viktigt att man dokumenterar allt och skapar tillräcklig metadata för varje objekt.

Men vi diskuterade också de problem som arkivens och bibliotekens höga kravnivå skapar. De som läser finska kan med fördel kasta ett öga på den utredning som nyss publicerades om forskarnas tankar kring digitala material. Jag har själv skrivit en litet inlägg om forskardriven digitalisering som väckt en del respons.

Vi tittade också på den äldsta bevarade filmsnutten av Joseph Niépce från 1888.

torsdag 9 februari 2012

Fyrk finns, finns förståelse?

Lektoratet i litteraturvetenskap vid Åbo Akademi dras in, mediehusen skär ner och de två stora förlagen slås ihop. Det råder krisstämning på finlandssvenskt håll. Hur ska det gå för det svenska språket, den svenska kulturens kärna i Finland? Litteraturen, de humanistiska vetenskaperna, undervisningen i skolorna, språket självt i vårt samhälle?

Frågan upplevs som akut. Vid seminariet Fyrk finns, finns kultur? som ordnades av litteraturvetarna i Helsingfors (främst Rita Paqvalén) och Nya Argus (främst Trygve Söderling) i dag fyllde den första salen över brädden, och en underbar samling finlandssvenska kulturknuttar och kreativa människor fick vandra i ankmarsch till en större sal. Snabbt räknade jag till 150 personer. Författare, förlagsfolk, forskare, kulturproducenter, film- och teatermänniskor …

Stämningen var inte aggressiv, inte "vi mot dom". Till detta bidrog att personer som Fred Karlsson och Leif Jakobsson deltog i diskussionen. Men även annars handlade det också till stora delar om saklig analys av både förvaltning och användning av kulturpengarna liksom av kulturfältet självt.

En mycket viktig sak som kom fram flera gånger under kvällen på olika sätt var språket. Det ekonomiska nyttospråket, som de facto är ett nonsensspråk, som infiltrerat sig så till den grad i administration och i beslutsfattande att allt nu kretsar kring kreativ ekonomi och annat strunt. Det är ett system där mätandet i praktiken alltid är kvantitativt, där innehåll och verksamhet i realiteten blivit sekundära.

Beror detta helt enkelt på att kvaliteten av substansen är omöjlig för beslutsfattarna att förstå? Man vill ha siffror att visa upp och analysera eftersom man inte klarar av att värdera substansen? Mätbara enheter att administrera och bedöma?

Inom företagsvärlden har man inte råd med dålig administration och överdriven byråkrati. Men på den offentliga sektorn är det ingen som hindrar förvaltningen att tvinga professorerna att sätta timmar på att fylla i reseräkningar och timrapporter i stället för att göra sitt jobb. Cheferna är trygga i sina grafer, "resultat" och tabeller som inget har att göra med verkligheten. Detta gäller tyvärr också i viss mån tredje sektorn.

Det är givetvis bekvämt. För beslutsfattarna. Siffrorna duger åt revisor, skatteverk och OECD. Problemet är att när man sedan måste skära händer det som hände i Åbo och som händer på varenda ministerium, inom kommunförvaltningen, på alla håll nu: man skär fullständigt planlöst, utan att se på funktionerna och verksamheten; man lämnar tjänster obesatta hur det råkar och de kvarvarande med arbetsbördan. Utan analys av eller ordentlig insikt i processer, i kompetenser, kommunikation och kunskap. Helt planlöst.

Ja, det är rätt att humanisterna måste återerövra språket. Man måste avslöja ledarskapet och dess innehåll för vad det verkligen är. Det är nämligen ofta visionslöst. Har man inte insikt i kultur kan man inte heller tänka strategiskt på innehållet. Då vill man ha kontrollsystem och blanketter, mätare och annat att dupera med. Låtsasstyrning med nonsenssystem. Men varför går kultur- och forskningsfältet med på detta?

Det handlar utom om språk även om ledarskap. Språket är redskapet, med det måste vi desarmera dessa tickande bomber. Men då måste vi, som också sades under seminariet, skärpa argumenteringen, ge alternativa lösningar och beskrivningar av världen. Men det får inte bli "vi mot dem", det måste vara en dialog. Man måste erbjuda goda alternativ, väl underbyggda lösningar. Och tro på att dessa segrar i längden.

Om beslutsfattarna i dag av olika orsaker inte alltid kan greppa innehållet och skapa visioner och strategi måste fältet göra det. Förlaget och författarna måste sätta sig ner tillsammans och på bred front diskutera vad man vill uppnå (för man är ju faktiskt på samma sida, de inser ju de flesta). Personalen vid ÅA måste bryta stämningen av allas krig mot alla och vaska fram gemensamma målsättningar och en väg framåt. Men det förutsätter också att beslutsfattarna deltar i diskussionen, utnyttjar expertisen och engagemanget som finns på fältet. Och inte smusslar med beslutsfattandet.

En kvistig fråga är frågan om ekonomi. Humanister och kulturfolk blir kränkta då man förhåller sig pejorativt till deras förmåga att förstå ekonomiska realiteter. Samtidigt vill man inte alltid acceptera ekonomiska argument och gå in i ekonomiska diskussioner. Senast när nonsensbegreppsapparaturen kommer på bordet bränner gemene humanist propparna, eftersom argumentationen är irrelevant. Här borde man hitta en medelväg. Förvaltningen bör acceptera att kvalitet inte kan mätas i siffror utan en hel del verksamhet har ett egenvärde och är en förutsättning för samhällets goda fortlevnad. Jag tror dessutom att de flesta beslutsfattare gärna medger detta. Så det finns hopp, så länge det finns diskussion.

måndag 6 februari 2012

Att digitalisera text


Dagens föreläsning handlade om digitalisering av text. Man kunde kanske tycka att det är en enkel sak att återge text i digital form: en bokstav är väl en bokstav? Men i verkligheten är man tvungen att ta ställning till många saker. Vägen från en bokstav på papper till en bokstav på en datorskärm är lång och invecklad.

En digital version av en text är alltid en ny utgåva, som kräver att man fattar beslut om vilka saker man ska ta med i det nya formatet: hur ingående beskrivande metadata behövs om själva källan och vad behöver man berätta om själva digitaliseringsprocessen? För vem görs digitaliseringen och hur ska det digitala materialet användas? Hur ska man strukturera själva texten? Behöver man återge grafiska element som layout och typsnitt? Hur gör man med sidnumrering? Vilket eller vilka exemplar av originalet väljer man att utgå från om det finns flera versioner? Vill man korrigera stav- och tryckfel?

En korrigering eller normalisering av texten ger en bättre sökbarhet men innebär också risk för feltolkning. Samtidigt kan man förlora information som i ett senare skede skulle ha varit relevant. Ju mer information man vill ta med, desto mer arbetsdryg och kostsam blir digitaliseringen. I utgångsläget bör man sträva till att bevara både en bild, alltså ett facsimil, av originalet och parallellt skapa en digital version av texten för att uppnå de fördelar en digital text har: tillgänglighet, sökbarhet och kopierbarhet.

Stora och välstrukturerade textkorpusar ger möjlighet att ställa nya typer av frågor till materialet. Genom digital gruvdrift kan man få syn på saker, mönster och regelbundenheter man annars inte noterat. Man kan söka igenom material som man inte under en livstid kunnat läsa igenom eller analysera på annat sätt. Samtidigt är de tekniska processerna i sig ogenomskinliga och svåra att utsätta för kritisk granskning. Ju mer strukturerad en text är, desto mer tolkning har gjorts vid framställningen, antingen av människor eller av datorprogram.

En viktig sak att minnas är dessutom att man vid gruvdrift av text egentligen alltid endast undersöker språket, inte en kultur, eftersom man maskinellt kan behandla endast tecknet, inte betydelsen. Om en betydelse har länkats till ett ord exempelvis genom hänvisning till en ontologi, har alltid en tolkning gjorts av någon utgående från den personens premisser och den information han just då haft till sitt förfogande.

Det finns ingen genväg då det gäller att förstå texter från en förgången tid och en annan kultur med en annorlunda världsbild. Man måste gå den långa vägen och lära sig språk och tankesätt från den tid man vill undersöka. Det kräver grundlig kring- och inläsning i textmaterial. Betydelserna och begreppen förändras kontinuerligt och varje text har uppkommit genom en skrivhandling i sin egen tid och kontext. Men den som har gjort det, och förstår och kan läsa en text på ett bra sätt besitter också viktig kontextuell information som han bör dela med sig. Genom metadata och annotering kan experter hjälpa oinsatta att inte missförstå eller misstolka texter. För digitala texter tenderar också att dyka upp lösryckta ur sitt sammanhang i den digitala världen. Historikerna och de som digitaliserar har här ett stort ansvar.

Vi kommer under senare föreläsningar att titta närmare på hur man källkritiskt måste gå till väga med digitala material.