Vad har Zacharias Topelius, Fredrika Tengström, J.L. Runeberg, J.V. Snellman, Elias Lönnrot, Eino Leino, Juhani Aho och Arvid Järnefelt gemensamt? Åtminstone det, att alla dessa storheter var engagerade i tidningsvärlden! Det var i den traditionen professor
Otto Andersson och arkivarie Albert Hästesko satte i gång verksamheten vid Brages Urklippsverk år 1910. Tidningspressen var ett otroligt viktigt kulturarv, som man visserligen vid Helsingfors Universitetsbibliotek uppgjort ett
sökregister för fram till slutet av 1800-talet, men nu hotades de svällande massorna tidningsmaterial av oanvändbarhet eftersom inget register längre kunde göras vid biblioteket. Man beslöt att i samband med
Föreningen Brage i Helsingfors grunda ett urklippsverk. Det var ingen poäng med att spara hela tidningar, för det gjordes ju vid biblioteken, utan det viktigaste var sökbarheten, att strukturera innehållet till ett enormt uppslagsverk. Alltså klippte man ut, ordnade upp och sparade innehållet ur svenskspråkiga tidningar och tidskrifter. Tyvärr gjordes inga lika omfattande projekt på den finska sidan.
Tidningsklipp och klippböcker var för många en viktig tradition och ett sätt att dokumentera och spara information under nästan hela 1900-talet. Detta har gällt både institutioner och privatpersoner. På 1990-talet ändrades världen plötsligt i takt med att webben blev allmännare, och verksamheten upphörde på de flesta håll. Men redan före det hade man på Urklippsverket reagerat på den tekniska utvecklingen inom informationsförvaltning. Under arkivchef Siv Westergårds ledning började man i stället för att klippa tidningar skapa en digital katalog över deras innehåll. Beslutet var mycket rationellt, modernt och inspirerat av den datorisering som brett ut sig i biblioteken i vårt land under 1980-talet. Man beslöt också, klokt nog, att bygga en egen databas som med tiden blev en välfungerande, dynamisk teknisk lösning, inte minst tack var insatser av Peter Hjelt som under många år tekniskt upprätthållit och uppdaterat systemet. Strukturen i databasen
Press hämtades till stor del från den allmänna internationella biblioteksstandarden, som är mycket välfungerande. De kloka beslut som fattades i början av digitaliseringen har lett till att vi i dag har en fantastisk resurs i form av en fungerande digital söktjänst på
Pressarkivets webbsida. Den saknar mig veterligen motsvarighet i världen i sin noggrannhet och omfattning. Inte ens om man skulle ha alla dessa finlandssvenska tidningar bevarade i fullt maskinläsbar text, skulle man på långt när kunna hitta lika bra i det stora materialet.
Det fanns endast ett riktigt stort krux med den fina planen i början av 1990-talet, och det var de för många släktforskare och akademiker så viktiga dödsannonserna, som inte längre gick att hitta via databasens referenser. Att spara hela tidningar tog också mycket plats, och nittiotalets nedskärningar ledde till att man måste flytta till mindre utrymmen. Alltså återgick man till att klippa, men fortsatte parallellt att indexera materialet i databasen. Fördelen med databasen är förstås att man där kan hitta fram till informationen på många vägar, till exempel via upphovsman eller olika ämnesord eller kategorier, i motsats till ett pappersklipp som kan arkiveras endast på ett ställe. Det bör dessutom påpekas att man vid Brages Pressarkiv, som den moderniserade verksamheten nu kallades, var noga med att använda ämneskategorier och ämnesord som i mån av möjlighet följer bibliotekens dito. Det är en sak som vi kan vara tacksamma över idag, eftersom det att man varit noggrann på dessa punkter nu gör att vi faktiskt har kompatibla, länkbara resurser.
Jag vill gärna förklara lite närmare vad det handlar om. Då man gör enkla sökningar i digitala filer, det må vara löpande text eller en databas, klarar datorn i normala fall att söka efter en viss exakt textsträng. Det innebär att man måste använda en exakt matchande stavning, synonym och böjningsform för att få relevanta sökresultat. Säg att man vill hitta information om händer. Ska man då söka efter ”hand”, ”händer” ... eller kanske ”övre extremiteter”? Eller kanske alla dessa? Man hamnar snabbt i en situation där sökandet blir ganska komplicerat, jobbigt och resultatet opålitligt. Om man dessutom söker endast i själva den löpande texten, kan man snabbt ge upp hoppet att få fram information som faktiskt är relevant. Har man däremot manuellt lagt till ämnesord enligt bestämda regler (i detta fall ”
händerna”) kan man kolla upp detta och få fram det man behöver. Denna process som kallas manuell indexering eller innehållsbeskrivning, kräver en del kompetens. Det gäller att känna till både materialet man beskriver och dess kontext så att man faktiskt vet vad som hänger ihop med vad och vad som är relevant. Men det gäller också att veta hur de olika verktygen och teknikerna fungerar, så att man får verkligt mervärde av den arbetsinsats som görs. Har man bra verktyg behöver den som lägger till ämnesorden inte ha mycket kunskap om den bakomliggande tekniken.
Det var just den bakomliggande tekniken på Brages Pressarkiv som vi jobbade allra mest med under min tid där (2011–2014), trots att det också resulterade i en mer modern och användarvänlig söktjänst, kallad
Presstanda. Detta kunde göras just tack vare de tidigare kloka besluten och det sakkunniga arbete som gjorts under åren. Tekniken har nämligen gått framåt från textsträngssökandet. I dag strävar man till att systemen och sökningarna också ska innehålla lite mer semantik, det vill säga att de ska innehålla information om de bakomliggande begreppen. Det gör att man kan beakta relationer mellan begrepp, så som synonymer eller över- och underordnade begrepp, eller till och med göra sökningar som är språkoberoende. För att det ska fungera behöver man så kallade ontologier, där all denna information om begreppen finns beskriven och lagrad. I Finland har vi internationellt sett kommit ganska långt inom detta område, för vi har faktiskt en nationell ontologitjänst,
Finto, där det är meningen att samla olika ontologier från olika kontexter. Inom
Pondus, det finlandssvenska nätverket för länkning av data, kom också bland andra Yle, Kulturforum och Brages Pressarkiv överens om samordning som skapar god kompabilitet mellan de olika informationsresurserna. I dag är nämligen inte den digitala världen endast webbsidor, utan det handlar allt mer om applikationer och flöden, som kräver öppna och helst länkade data för att fungera tillfredställande i en splittrad digital miljö.
Det är alltså ingen lösning att skanna in alla tidningsarkiv eller börja lägga lite lösryckta nyckelord på journalistiska material. Det ger kanske en något bättre sökbarhet, men vi har i databasen Presstanda ett fullständigt unikt koncept och en enorm resurs som verkligen betjänar användarna. Ämnesorden är enhetliga och sökningen täcker alla de finlandssvenska dagstidningarna (utom de senaste årens åländska tidningar, eftersom dessa inte hittills varit redo att satsa på de nya digitala samarbetsformerna). Ämnesorden är försedda med semantisk tilläggsinformation och sökningarna kan mycket enkelt anpassas så att man avgränsar sökningen till enskilda tidningar, skribenter, artikeltyper, tidsperioder och så vidare. Funktionalitet och användarvänlighet är överlägsna till exempel alla tidningarnas egna sökfunktioner. Presstanda ger dessutom möjlighet att enkelt använda dess funktioner i andra tjänster. Om bara tidningarna själva ville det, kunde deras sökningar utnyttja Presstanda i bakgrunden. Hittills har man inte vid tidningarna varit särskilt intresserad av detta. Man ser uppenbarligen inte vikten av sökbarhet i arkiven eller till exempel de möjligheter att erbjuda tidningsläsarna anpassade digitala innehåll som systemet kunde erbjuda. Man fortsätter i stället att producera dåligt strukturerade material för miljoner för att sedan låta det begravas i arkiven, eller färdigpaketerade papperstidningar i digitalt format.
Vid Brages Pressarkiv finns också personal som har åratal av erfarenhet och som känner den finlandssvenska kulturen och hurdana behov som finns där gällande informationssökning mycket bra. Dessa personer, just nu de fastanställda Viveka Högnäs-Mellner, Gun Grönroos och Marika Aminoff-Sundell, har stor rutin och sakkunskap gällande indexering av textjournalistik och informationssökning i tidningsmaterial. Vad vi nu ser hända på olika håll är att man vid de mest upplysta tidningarna börjar inse att en liten, liten insats för att förbättra sökbarheten ökar effektiviteten och trovärdigheten avsevärt. Risken finns dock att man nu på alla tidningar separat börjar lägga till påhittade ämnesord lite hur det passar i all hast, i stället för att skapa en hållbar standardiserad lösning. Och vad vore bättre än en centraliserad finlandssvensk indexeringstjänst med experter, som förmånligt och effektivt skapar enhetlig sökbarhet enligt internationella standarder med öppen och länkad data? Det låter visst lite bekant, konceptet?
Den enda utmaningen är tempot som tidningarna kräver, men detta är en sak som går att lösa om man är redo att tänka om och integrera processerna (inklusive de digitala systemen, ”digital first” som jag nämnde i min inledande
kommentar i detta nummer [
Nya Argus 12/2014]). Det kräver dock att man tillmäter den expertis som finns vid Pressarkivet den status den är värd. För den är som sagt en unik finlandssvensk resurs och möjlighet, som dessutom är hotad på ett skandalöst sätt.
Presstanda kunde också i framtiden erbjuda en allt större krets textproducenter samma möjligheter att skapa synlighet, flöden och sökbarhet för sina material. En del tidskrifter har redan börjat indexera sina material själva och det finns ingenting som säger att inte enskilda journalister eller sammanslutningar som producerar journalistiska material kunde publicera och marknadsföra sina material via Presstanda direkt till allmänheten. Eller varför inte sina böcker? I princip finns tekniken där, den behöver endast små kompletteringar som kostar en spottstyver i jämförelse med de summor man bollar med i branschen i dag. Via Presstanda kunde man samtidigt publicera, distribuera, kuratera, hitta, prenumerera och konsumera precis exakt sådana material på artikelnivå som man är intresserad av. Tack vare de öppna lösningarna behöver inte konsumenterna nödvändigtvis ens använda Presstanda, utan information kan hitta dem andra vägar, via applikationer, flöden eller länkad data, som till exempel förslag på relaterade material på olika håll.
Frågan är om man är färdig att se på mediefältet i dag och i framtiden ur användarnas perspektiv, och erbjuda dem det de vill ha (inte det de tror att de vill ha). Eller väljer man att lägga ner en indexeringsverksamhet som ligger i framkant både nationellt och internationellt – och bara ”bevara klipparkivet”, vilket man låtit förstå från Svenska litteratursällskapets sida? Det finns en risk att surandet över statens dumma nedskärningar nu leder till att man försitter en chans att skapa en av de nya plattformar som kommer att behövas inom kort. På samma gång gör man sig av med kompetens och verksamheter som är strategiska och kritiska framgångsfaktorer för det svenska i Finland.
Var finns dagens runebergar och lönnrötter och hur ska man kunna trygga att viktiga element av vår kultur inte försvinner eller begravs i ett ogenomträngligt ostrukturerat brus? Hur ska vi försäkra oss om att den finlandssvenska moderna kulturen har digitala rum, forum och kanaler där läsare och skribenter kan hitta varandra, där idéer kan frodas och dialog föras? Hur kan man organisera allt på ett rationellt sätt så att resurser används främst på det viktiga skapandet av texter och andra digitala material som får verklig spridning och genomslag? Det är dessa frågor man borde diskutera. En del av lösningen på alla dessa frågor kunde finnas i Presstanda och Brages Pressarkiv. Men det börjar tyvärr bli bråttom att agera och det krävs vision, strategiskt tänkande och framför allt mod av dem som beslutar om hur tillgångarna fördelas i Svenskfinland.
[Artikeln är tidigare publicerad i Nya Argus 12/2014, som var ett temanummer om finlandsvenska medier]