I dag deltog jag i ett seminarium på CSC om digitalt långsiktigt bevarande. Under förmiddagen fick vi höra det senaste om de administrativa, politiska och juridiska utvecklingarna kring detta med långsiktigt bevarande. Det känns bra att forskningsdata och kulturarvsdata tydligtvis vallas fram som parallella projekt av Undervisnings- och kulturministeriet. Det finns många synergier att vinna. En liten aning fundersam blev jag över exakt hur man egentligen ser KDK-projektets funktion i ett nationellt infrastrukturperspektiv och hur exempelvis hela ONKI-projektet egentligen faller in i bilden. Det talades nämligen till exempel om semantisk kompatibilitet. Det är möjligt att jag lyssnade lite okoncentrerat där. I alla fall tänker jag att skulle det vara en mycket god sak om öppenheten ännu starkare fanns med som strategisk målsättning i alla projekt som bedrivs. För allt bedrivs som projekt för närvarande. I längden är det förstås inte hållbart att LDB är ett projekt, eller ontologier eller annan central nationell infrastruktur.
Under lunchen fördes en intressant diskussion om hur mycket användargenererad metadata ska pressas in i metadatascheman redan vid inmatningsskedet. Riksarkivet har valt en mycket ambitiös linje här. Det återstår att se hur väl det fungerar. Man kunde nämligen eventuellt också fundera på att behandla och putsa datan i efterskott - med nästan samma insats, slog det mig efteråt. Frestelsen att vända logiken helt tvärtom skulle nog vara stor för mig personligen. Med en målsättning att samla så mycket data som möjligt (ni vet det där med öppenhet och ny kunskap) och sedan börja fundera på var man kan göra av den. Bättre att "tänka efter före" eller att "think smart, act fast"? Och hur mycket utesluter dessa varandra? I det digitala brukar det gå att göra både och, om man bara vill.
Men mitt verkliga "tänka-på" fick jag i workshopen om formatmigrering. Vi jobbade med JODconverter och konverterade Microsoft Office-dokument (både gamla binära och nyare x-dokument) till ODF och vidare till PDF och PDF/A. Och jag kan bara konstatera att jag blev kallsvettig. I stort sett allt som kunde gå fel, gick fel, utom helt enkel text. Powerpointarna blev förskräckliga, kalkylbladen tappade formatering, alla WordArt och SmartArt etc blev helt galna, texten bytte färg, fonter, bilder försvann eller hamnade rakt på texten i pdf-filen, tabeller gick sönder. Och så vidare och så vidare. Kan bara konstatera att jag hädanefter tänker efter minst två gånger innan jag skriver in migrering som primär bevaringsstrategi för dylika dokument. Som ett konkret råd:
Be användarna själva skapa och kontrollera pdf-filerna.
I morgon ska vi fortsätta med bildfiler. Det finns plats i gruppen. Rekommenderar varmt alla att delta som jobbar med bilder. Fast det lär inte vara riktigt lika illa.
Avundas ändå inte killarna på PAS. Deras uppdrag är minst sagt utmanande.
Karamellipaperit pelivälineenä
12 timmar sedan
Inga kommentarer:
Skicka en kommentar