Säilitamine - juhised ja nõuanded - vormingud

Vormingud

 

Säilitamisstrateegiat koostades on oluline eristada arhiivi- ja kasutuskoopiaid. Enamasti digiteeritakse maksimaalse võimaliku kvaliteediga ning saadud arhiivikoopiad säilitatakse algkujul ehk ilma töötlemata. Arhiivikoopia säilitamiseks kasutatakse avatud ja levinud failivormingut ning andmekandjat. Kindlasti tuleks hoiduda arhiivifailide krüpteerimisest ja kompresseerimisest.

 

Kasutuskoopiaid tuleks aga hoida sellistes vormingutes ning töödelda nii, nagu projekti paremaks esitamiseks tarvilik on.

 

Enamasti on kasutuskoopiad arhiivifailidest väiksemad, vajadusel on neile tehtud värvikorrektuuri ning teravustatud. Selleks, et pilte oleks Interneti kaudu mugav kätte saada, on nad kompresseeritud ning neid hoitakse jpeg- või mõnes muus väikesemahulises vormingus. Praegusel ajal on küllalt uusi väikesemahulisi vorminguid, mis pilti eriti ei moonuta, kuid milles hoidmisel kasutatakse väga vähe ruumi. Üks selliseid uusi on näiteks DjVu (http://www.djvuzone.org/), veel on uued formaadid MrSID, Genuine Fractals ja PixelLive/VFZoom. Need, kes hindavad kasutusfailide puhul vormingu stabiilsust, võiksid eelistada PNG ja JPEG 2000 vorminguid, kuna mõlemad on avatud, hästi ühilduvad (põhinõue kasutusfailidele!) ning ka andmemahu kasutamine on üsna efektiivne.

 

Kasutusfailide puhul pole vormingute avatus ja stabiilsus prioriteetsed, kuna eesmärgid on teised.

Seoses sellega, et arhiivifailid võtavad kasutuskoopiatest oluliselt rohkem ruumi ning neile ei pea olema pidevat juurdepääsu, tuleb nende puhul kasutada ka erinevaid andmekandjaid. Enamasti räägitakse arhiivifailide säilitamise puhul off-line ning kasutuskoopiate puhul on-line säilitamisest. Off-line tähendab, et faile hoitakse ilma neile arvutivõrgu kaudu juurdepääsu võimaldamata ja on-line puhul vastupidi.

 

Esimest võimaldavad kõigile tuntud CD-R ja DVD-R plaadid ning mitmesugused lindilahendused (DAT, DLT). On-line säilitamismeetod tähendab seda, et faile hoitakse paljudest kõvaketastest koosnevas kettamassiivis, millele on loodud juurdepääs arvutivõrgu (Interneti) kaudu.

 


Säilitamine - juhised ja nõuanded - andmekandjate säilitamine

Andmekandjate säilitamine


Ükskõik millise andmekandja kasuks arhiivifailide puhul otsustatakse, tuleb neisse suhtuda ülima tähelepanu ja hoolikusega. Eriti keeruliseks ja vastutusrikkaks teeb arhiivifailide säilitamise asjaolu, et ühtki senistest lahendustest pole kasutatud üle mõneteistkümne aasta ning keegi ei tea täpselt, kuidas need ajahambale vastu peavad. Oma osa on ka tehnoloogia kiirel arengul, mis tähendab, et andmekandja (näiteks CD) aastakümnete pikkune kestvus polegi nii oluline, kui info õigeaegne uutele andmekandjatele kopeerimine. Vastasel juhul võib juhtuda, et plaat on aastaid hiljem loetav, kuid pole, MILLEGA seda lugeda. Info läheb kaduma, mis tähendab, et säilitamisstrateegia pole olnud tulemuslik.

 

Minimeerimaks mitmesuguseid säilitusriske ning abistamaks heade otsuste tegemisel on Rahvusarhiivis koostatud mitu juhist. Viimane neist, "Digitaalarhiivinduse strateegia 2005-2010", katab ka kõiki säilitamisega kaudselt või otseselt seonduvaid teemasid (digitaalarhiivi mudel, kirjeldamine ehk metaandmestik, hindamine, dokumentide üleandmine, säilitamine, kasutamine), vt. http://www.eha.ee/digistrateegia.pdf

 

Rahvusarhiivi poolt väljaantud juhis "Digitaalse info hoidmine CD-Ril" (http://www.ra.ee/juhised/cdjuhis.pdf) sisaldab kasulikku teavet tänasel päeval enamlevinud optiliste andmekandjate ehk CD-dega ringikäimiseks, kuidas plaate säilitada ja neile salvestada, mida teha siis, kui plaat on loetamatu jne.

Säilitamine - juhised ja nõuanded - failide nimetamine

Failide nimetamine

 

Tänapäeval on paljud, eriti Microsoft Windowsi operatsioonisüsteemide kasutajad harjunud pikkade failinimedega ja reeglina ei pööragi faili nimetamisele tähelepanu, sest rakendustarkvarad pakuvad selle välja automaatselt ja kasutajal on võimalus see vaid kinnitada. Faili nimi meenub alles siis, kui see otsimisel vajalikuks osutub. Selleks, et salvestatud informatsiooni oleks võimalik kasutada ka teiste operatsioonisüsteemidega, tuleb kasutada ISO 9660:1988 standardit (määrab ka CD-ROMi ja CD-Ri failisüsteemi vormingu).

 

Standardi esimene tasand määrab nn 8.3-süsteemi, kus failinimi koosneb kaheksast tähemärgist, punktist ja kuni kolmest tähemärgist faili laiendi osas (nt failinim.txt). Tühikud ja teatud sümbolid on failinimes keelatud. Sama standardi teine tasand, mille töötas välja Microsoft, lubab kasutada failinimes 64 tähemärki (ka tühikuid ja teisi 8.3-süsteemis keelatud sümboleid). Selliseid failinimesid suudavad teised operatsioonisüsteemid (Mac, Unix jne) küll tunnistada ja võimaldavad faile kasutada, kuid failinime pikkus muutub: see lüheneb nii, et ta mahuks 8.3-süsteemi (nt pikkfailinimi.txt muutub pikkfai~1.txt). Nimetatud muudatused digiarhivaalide failinimedes ei võimalda neid enam kokku viia teabega failide loogilise paigutuse ja nimetuste kohta; need andmed peavad aga arhiivieeskirja punkt 951 kohaselt olema lisatud igale arhivaalile.

 

Otstarbekas on võimaluse korral jääda ISO 9660 standardi esimese tasandi juurde, kui see pole võimalik, tuleks kasutada ülalnimetatud standardi teist tasandit.

Säilitamine - juhised ja nõuanded - Domesday

Domesday projekt

BBC Domesday projekt on üks tuntumaid näiteid säilitamisstrateegia alahindamisest. Selle põhjal võib järeldada, et isetegevus ei kanna digitaalses maailmas vilja, kuna erilahendustel on kalduvus aja jooksul kaduda või kasutuskõlbmatuteks muutuda.

 

Lühidalt kurikuulsast BBC Domesday projektist

 

Domesday projekt käivitati 1986. aastal ja see kujutas endast fotode, tekstide, samuti heli- ja videolõikude kollektsiooni. Materjalid koguti kokku koolidest ning projekti eesmärk oli kaudselt jäljendada 900 aastat varem ilmunud kuningas William Vallutajale kirjutatud Domesday raamatut (http://www.domesdaybook.co.uk/). Viimane kirjutati selleks, et kuningas teaks, kas ja kui palju saab Inglismaalt sõjaväe jaoks  makse koguda, juhul kui Skandinaaviast peaks Inglismaad rünnatama. Raamatusse pandi kirja kogu maine vara koos asukohta, omanike, teenistujate ja muuga.

 

Kogutud materjal salvestati kogutud laserloetavatele plaatidele, millelt info lugemiseks loodi spetsiaalsed masinad. Kuigi projekti käivitamise ajal olid nii need plaadid kui ka lugerid üsna levinud, pole tänapäeval enam võimalik leida ühtegi sellist plaati ega masinat, millega neid esitada. Seega on tollal kogutud ja salvestatud materjal hävinenud.

 

Kui tollal oleks säilitamisstrateegiale pööratud suuremat tähelepanu , olekstõenäoliselt kogu materjal tänapäevalgi kättesaadav. Tuleb siiski nentida, et BBC on esimesest šokist üle saanud ning mõned aastad tagasi moodustatud töörühm on praeguseks välja töötanud lahenduse, mille abil on paarilt säilinud plaadilt kogu info kättesaadud.