Sidkarta   |   Kontakt
 
Större textMindre text

Terminologi

Inom långsiktigt digitalt bevarande används specialterminologi. Majoriteten av alla begrepp har uppkommit på engelska och flera saknar ännu en god svensk motsvarighet. Den här listan med termer och begrepp är SLS insats till att överföra den digitala världen till svenska.

 

Administrativa metadata: metadata för långsiktigt bevarande av digitala objekt och för tekniskt igenkännande av filer. Administrativ metadata dokumenterar filers proveniens. Till administrativa metadata räknas också tekniska metadata. Administrativa metadata behövs för att de digitala objekten skall vara trovärdiga och för att man skall kunna bevara de digitala objekten.

Användarproducerat innehåll (user generated content): Material som användarna sparat över webben och som publicerats direkt enligt den sk. webb 2.0-modellen, den interaktiva webben. Till exempel bloggar eller taggar är användarproducerat innehåll.

Autenticitet: autenticitet är nära förknippat med trovärdighet och proveniens. Eftersom digitala objekt lätt kan kopieras och även förändras på ett ofta osynligt sätt kan det vara svårt att fastställa autenticiteten på digitala objekt. Med noggrant dokumenterad proveniens kan man tolka det digitala objektet i förhållande till ett originalobjekt och sålunda fastslå graden av autenticitet. Integritet är också viktigt för autenticiteten.

Beskrivande metadata: metadata som beskriver resursens innehåll. Beskrivande metadata hjälper att identifiera objekt och är till för att man skall kunna söka efter och hitta material. Beskrivande metadata skrivs delvis för människor och skall underlätta användningen av materialet. Delvis bör också beskrivande metadata vara maskinläsbara och skall t.ex. kunna användas i ontologier. Beskrivande metadata beskriver främst intellektuella entiteter som kan bestå av flera digitala objekt.

Bevarande (curation): Digitala resurser kräver aktivt underhåll för att förvaras, till skillnad från passiv lagring av data. Korrekt bevarande kräver omvärldsbevakning, ordentlig fil- och metadatahantering, möjlighet att migrera vid behov samt även återhämtning.

Dataröta (bit rot): innebär att filer kan degenerera av sig själva även då de inte används. Fenomenet förekommer inte ofta, men sannolikheten för dataröta ökar i takt med mängden digitalt material. Orsaken till dataröta är inte känd.

Digitalbaserat material (born digital, alkujaan sähköinen): Material som uppstått i digital form, alltså digitala objekt som inte baserar sig på ett fysiskt original, utan med ett digitalt objekt som original. Exempel på born digital-material är fotografier tagna med digitalkamera, ljudinspelningar som är gjorda med ett digitalt medium, samt t.ex. i fråga om tjänstearkivet word-dokument, e-post och webbsidor. Skannade dokument är inte digitalbaserade, inte heller ljudinspelningar eller filmer som digitaliserats ur analoga original. Digitalbaserat material kräver noggrannare metadata om objektets proveniens och tekniska aspekter för att man i framtiden skall kunna försäkra sig om objektets autenticitet.

Digitalt objekt: ett digitalt objekt (ibland förkortat DO) är oftast det samma som en fil (bild, ljud osv.). Ett fysiskt dokument (enhet) kan bestå av flera sidor eller delar som alla utgör ett eget digitalt objekt. Varje version (filformat) av samma objekt utgör också ett eget objekt.

Enhet: enheten är en samling digitala objekt som alla är en del av samma fysiska original. Med andra ord är en enhet en fysisk variant av en intellektuell entitet.

Exporter: att föra över metadata från ett arkiv till ett annat sker via exporter. Då tas data ur databaser till text i ett format eller annat (oftast xml) och ofta så att dokumentet följer en viss syntax (olika standarder för export).

Fönsterapplikation (widget, leijuke): Ett tilläggsprogram med vilket man kan integrera information från annan webbsida eller databas i ett gränssnitt eller en webbsida.

Händelse (event): Med händelser menas i det här sammanhanget i databasen registrerade händelser som påverkar de digitala objekten. En händelse är alltså ett sätt att dokumentera digitala objekts proveniens. Exempel på händelser är skapande av objekt, beräkning av kontrollsumman och migrering.

Hittbarhet (findability): Egenskaper hos ett digitalt objekt som gör att det kan hittas vid sökningar. Relevanta metadata och synlighet i register och portaler är viktiga kriterier

Höstning (metadata harvesting): att automatiskt samla in metadata från olika databaser över internet. Metoden används av t ex Europeana.

Identifikator (identifier): är ett unikt namn eller adress till ett digitalt objekt, en intellektuell entitet och en händelse. Identifikatorerna skall vara oföränderliga och helst följa ett logiskt schema. Man kan även registrera sina identifikatorer i större system, så som Digital Object Identification System (DOI) och URN. Arkivas identifikatorsystem och -syntax är dokumenterade.

Integritet (fixity): integritet innebär att det digitala objektet inte har förändrats inom en viss tidsperiod. Det kan man försäkra sig om genom att räkna ut kontrollsummor av ett objekt på olika tidspunkter och jämföra dem. Om summorna är samma är objektet oförändrat och dess integritet bevarad. Orsaker till att objekt förändras kan t ex vara medveten förändring eller latent dataröta.

Intellektuell entitet (intellectual entity): en intellektuell entitet är innehållet i ett eller flera digitala objekt som har beskrivits med metadata. En intellektuell entitet kan vara ett foto, ett brev (bestående av flera digital objekt) eller en hel samling. När det skapas nya versioner av samma innehåll t.ex. vid migrering eller som användarkopior är den intellektuella entiteten densamma även om det digitala objektet förändras. Det är viktigt att tänka på när man talar om proveniens, dvs. talar man endast om den nuvarande filens historia eller om innehållets digitala historia?

Kontrollsumma (check sum): en algoritm som räknar om data till en summa. Kontrollsummor behövs för att garantera att filer inte har ändrats eller degenererat under en period, en integritetskontroll. Om en fil har förändrats blir kontrollsumman också en annan. Den kontrollsumma som används i Arkiva är MD5 som är en 128-bits kontrollsumma.

Metadata: data om data, med andra ord information om ett digitalt objekts innehåll och tekniska egenskaper.

Migrering: när man konverterar filer från ett filformat till ett annat med tanke på långsiktigt digitalt bevarande eller byter lagringsmedia är det fråga om migrering av filer. Migrering görs för att den datatekniska omgivningen förändras och vissa filformat blir föråldrade eller på annat sätt instabila.

Ontologier: inom informationsvetenskapen är ontologier en klassifikation av namngivna termer och deras förhållande. En ontologi är central inom semantiska webben eftersom begreppen är maskinläsbara. Ontologier fungerar för användaren som en avancerad tesaurus eftersom den kan förstå termers inbördes relationer, deras utveckling, olika betydelser av samma ord och olika språk. En ontologi kan t ex skilja på Degerby i Ingå och Degerby på Åland, samt veta om det är fråga om f d kommunen Degerby. T ex kan en ontologi också förstå över- och underordnade begrepp så som himlen, som kan vara en religiös term. Man kan söka på religiösa företeelser och hitta himlar i religiös betydelse, men inte himlar som definierats som naturbegrepp.

Permanent identifikator (persistent identifier): en entydig och oföränderlig identifikator. En idenfikator bör per definition aldrig förändras. I praktiken avses i det här sammanhanget ofta en permanent URL-adress eller sökväg till en fil, där det för material som är publicerat på webben är viktigt att adressen inte förändras.

Proveniens (provenance): Inom digitala arkiv är proveniens det digitala objektets och den digitala resursens egen historia. När och hur det digitala objektet har skapats eller modifierats är typiska exempel på det digitala objektets proveniens. När och hur man har migrerat från äldre filformat till nyare är ett exempel på resursens historia.

Resurs: en resurs kan betyda både ett digitalt objekt, en intellektuell entitet eller ett fysiskt originalobjekt, beroende på sammanhanget. Begreppet resurs används i flera metadatastandarder men i mindre grad inom Arkiva.

Strukturella metadata: metadata som beskriver filers förhållande till varandra. Är viktigt för att kunna representera intellektuella entiteter som består av många filer samt att hålla reda på alla olika versioner och format av samma resurs.

Säkerhetskopiering (backup, varmuuskopiointi): att skapa kopior av det digitala materialet för att minska riskerna för att det skall gå förlorat. Ett ordentligt system för säkerhetskopiering bygger på två faktorer: redundans och diversitet. Det innebär att systemet är säkrare ju flera kopior man har av sitt material och ju flera olika lagringsmedier man har sina kopior på. Se t ex projektet LOCKSS (Lots of Copies Keep Stuff Safe).

Tekniska metadata: metadata som beskriver filers tekniska egenskaper. Behövs för att förstå, tolka, öppna och bevara det digitala objektets egenskaper.

Trovärdighet (trustworthy, uskottavuus): trovärdighet är ett viktigt begrepp när man talar om digitalt material. För att ett digitalt objekt skall anses trovärdigt måste man dokumentera objektets proveniens och tekniska aspekter noggrant. Dokumenterad proveniens förstärker objektens autenticitet. En viktig del av denna autenticitet och proveniens är integritetskontroller. Digitala objekt blir också trovärdiga ju mera de används och förekommer i olika sammanhang, så som KDK eller Europeana. Synlighet och en faktor av igenkännande är med andra ord viktiga för trovärdigheten i en värld då ursprunget endast kan dokumenteras men inte verifieras.

URI: Uniform Resource Identifier. Används för att identifiera eller namnge ett objekt. URI:n kan vara antingen en URN eller en URL. URN är ett registrerat namn på objektet medan en URL är en adress till objektet. URL skrivs t.ex. som länkar till Internetadresser eller som sökvägar till filer på en hårdskiva.

Validering: validering av filer innebär att man med program kontrollerar att filens interna syntax på bitnivå är korrekt enligt filens format. Varje format har en egen syntax. Med validering kan man försäkra sig om att filen är ett sådant format som den utger sig för att vara och att den inte är skadad på ett strukturellt sätt.

Återhämtning (disaster recovery): vid systemfel eller andra fel måste ett digitalt arkiv kunna återställa information som gått förlorat. Kräver diversifierade säkerhetskopior och ordentliga dokumenterade rutiner för problemfall.

Övergivna verk (orphan works): Verk vars upphovsrättsinnehavare är okänd.

 

Svenska litteratursällskapet i Finland | PB 158, 00171 Helsingfors | Tfn (09) 618 777 | info(a)sls.fi |